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I * 1 libro que tiene en sus manos le proporciona un amplio panorama 

1 V de modelos de probabilidad y métodos estadísticos, a través de 
ejemplos frescos y cuidadosamente seleccionados y graduados en el nivel 
de dificultad. Ahora, en la séptima edición, el autor presenta además una fuerte 
cobertura computacional con aplicaciones en SAS y MINITAB. 

Características 

• Contiene numerosos ejemplos basados en casos reales y con los datos 
auténticos. 

• Las actividades a desarrollar tienen diferentes niveles de dificultad. 

• El autor hace hincapié en que el estudiante aprenda a interpretar y no 
únicamente mecanice. 

Estamos seguros de que no encontrará otra publicación igual en español que le 
ayude con tanta claridad a abordar y entender los diversos temas que conforman 
la probabilidad y estadística, así como a desarrollar su habilidad de análisis y 
solución de las actividades planteadas. 
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Prefacio 





Propósito 

El uso de modelos de probabilidad y métodos estadísticos para analizar datos se ha conver¬ 
tido en una práctica común en virtualmente todas las disciplinas científicas. Este libro pre¬ 
tende introducir con amplitud aquellos modelos y métodos que con mayor probabilidad se 
encuentran y utilizan los estudiantes en sus carreras de ingeniería y las ciencias naturales. 
Aun cuando los ejemplos y ejercicios se diseñaron pensando en los científicos e ingenieros, 
la mayoría de los métodos tratados son básicos en los análisis estadísticos en muchas otras 
disciplinas, por lo que los estudiantes de las ciencias administrativas y sociales también se 
beneficiarán con la lectura del libro. 

Enfoque 

Los estudiantes de un curso de estadística diseñado para servir a otras especialidades de es¬ 
tudio al principio es posible que duden del valor pertinencia de la materia, pero mi experien¬ 
cia es que los estudiantes pueden ser conectados a la estadística con el uso de buenos 
ejemplos y ejercicios que combinen sus experiencias diarias con sus intereses científicos. 
Así pues, he trabajado duro para encontrar ejemplos reales y no artificiales, que alguien pen¬ 
só que valía la pena recopilar y analizar. Muchos de los métodos presentados, sobre todo en 
los últimos capítulos sobre inferencia estadística, se ilustran analizando datos tomados de 
una fuente publicada y muchos de los ejercicios también implican trabajar con dichos da¬ 
tos. En ocasiones es posible que el lector no esté familiarizado con el contexto de un pro¬ 
blema particular (como muchas veces yo lo estuve), pero me di cuenta que los problemas 
reales atraen más a los estudiantes con un contexto un tanto extraño que por problemas de¬ 
finitivamente artificiales en un entorno conocido. 

Nivel matemático 

La exposición es relativamente modesta en función de desarrollo matemático. El uso sus¬ 
tancial del cálculo se hace sólo en el capítulo 4 y en partes de los capítulos 5 y 6. En par¬ 
ticular, con excepción de una observación o nota ocasional, el cálculo aparece en la parte de 
inferencia del libro sólo en la segunda sección del capítulo 6. No se utiliza álgebra matricial 
en absoluto. Por lo tanto, casi toda la exposición deberá ser accesible para aquellos cuyo co¬ 
nocimiento matemático incluye un semestre o dos trimestres de cálculo diferencial e in¬ 
tegral. 

Contenido 

El capítulo 1 se inicia con algunos conceptos y terminología básicos (población, muestra, 
estadística descriptiva e inferencial, estudios enumerativos contra analíticos, y así sucesiva¬ 
mente) y continúa con el estudio de métodos descriptivos gráficos y numéricos importantes. 
En el capítulo 2 se ofrece el desarrollo un tanto tradicional de la probabilidad, seguido por 
distribuciones de probabilidad de variables aleatorias continuas y discretas en los capítulos 
3 y 4, respectivamente. Las distribuciones conjuntas y sus propiedades se analizan en la pri¬ 
mera parte del capítulo 5. La última parte de este capítulo introduce la estadística y sus dis¬ 
tribuciones muéstrales, las cuales constituyen el puente entre probabilidad e inferencia. Los 
siguientes tres capítulos se ocupan de la estimación puntual, los intervalos estadísticos y la 
comprobación de hipótesis basados en una muestra única. Los métodos de inferencia que 
implican dos muestras independientes y datos apareados se presentan en el capítulo 9. 
El análisis de la varianza es el tema de los capítulos 10 y 11 (unifactorial y multifactorial, 
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respectivamente). La regresión aparece por primera vez en el capítulo 12 (el modelo de re¬ 
gresión lineal simple y correlación) y regresa para una amplia repetición en el capítulo 13. 
Los últimos tres capítulos analizan métodos de ji cuadrada, procedimientos sin distribución 
(no paramétricos) y técnicas de control de calidad estadístico. 

Ayuda para el aprendizaje de los estudiantes 

Aunque el nivel matemático del libro representará poca dificultad para la mayoría de los es¬ 
tudiantes de ciencia e ingeniería, es posible que el trabajo dirigido hacia la comprensión de 
los conceptos y apreciación del desarrollo lógico de la metodología en ocasiones requiera 
un esfuerzo sustancial. Para ayudar a que los estudiantes ganen en comprensión y aprecia¬ 
ción he proporcionado numerosos ejercicios de dificultad variable desde muchos que impli¬ 
can la aplicación rutinaria del material incluido en el texto hasta algunos que piden al lector 
que extienda los conceptos analizados en el texto a situaciones un tanto nuevas. Existen mu¬ 
chos ejercicios que la mayoría de los profesores desearía asignar durante cualquier curso 
particular, pero recomiendo que se les pida a los estudiantes que resuelvan un número sus¬ 
tancial de ellos; en una disciplina de solución de problemas, el compromiso activo de esta 
clase es la forma más segura de identificar y cerrar las brechas en el entendimiento que ine¬ 
vitablemente surgen. Las respuestas a la mayoría de los ejercicios impares aparecen en la 
sección de respuestas al final del texto. Además, está disponible un Manual de Soluciones 
para el Estudiante, que incluye soluciones resueltas de casi todos los ejercicios de número 
impar. 

Nuevo en esta edición 

• Ejercicios y ejemplos nuevos, muchos basados en fuentes publicadas que incluyen datos 
reales. Algunos de los ejercicios permiten una interpretación más amplia de los ejerci¬ 
cios tradicionales que incluyen cuestiones muy específicas y algunos de éstos implican 
material de las primeras secciones y capítulos. 

• El material de los capítulos 2 y 3 sobre propiedades de probabilidad, conteo y tipos de va¬ 
riables aleatorias se reescribió para alcanzar una mayor claridad. 

• La sección 3.6 sobre la distribución de Poisson ha sido revisada, incluido el material nue¬ 
vo sobre la aproximación de Poisson a la distribución binomial y la reorganización de la 
subsección sobre procesos de Poisson. 

• El material de la sección 4.4 sobre distribuciones gama y exponencial ha sido reordenado 
de tal suerte que las segundas aparecen antes que las primeras. Esto es muy conveniente 
para aquellos que desean abordar la distribución exponencial y evitar la distribución gama. 

• Una breve introducción al error en la media de los cuadrados en la sección 6.1 ahora apa¬ 
rece como ayuda para motivar la propiedad de insesgabilidad y se da un ejemplo nuevo 
que ilustra la posibilidad de tener más de un solo estimador insesgado razonable. 

• Existe un énfasis disminuido en los cálculos manuales en el ANOVA multifactorial para 
reflejar el hecho de que ahora hay software apropiado ampliamente disponible y ahora se 
incluyen gráficas residuales para verificar suposiciones de modelo. 

• Se han realizado miles de pequeños cambios en la redacción a lo largo del libro para me¬ 
jorar las explicaciones y pulir la exposición. 

• El sitio web incluye applets Java™ creados por Gary McClelland, específicamente para 
este texto basado en el cálculo, así como también conjuntos de datos tomados del texto 
principal. 

• WebAssign, el sistema de asignación de tareas más ampliamente utilizado en la educación 
superior, permite asignar, reunir, calificar y registrar tareas vía la web. Este comprobado 
sistema de asignación de tareas ha sido mejorado para incluir vínculos al contenido espe¬ 
cífico del texto, ejemplos de video y tutoriales propios del problema. Disponible para es¬ 
te libro, Enhanced WebAssign es más que un sistema de asignación de tareas; es un 
completo sistema de aprendizaje para los estudiantes. 


















Material de apoyo para el profesor 

Este libro cuenta con una serie de recursos para el profesor, los cuales están disponibles en 
el inglés y sólo se proporcionan a los docentes que lo adopten como texto en sus cursos. 
Para mayor información, póngase en contacto con el área de servicio a clientes en las 
siguientes direcciones de correo electrónico: 

Cengage Learning México y Centroamérica clientes.mexicoca@cengage.com 

Cengage Learning Caribe clientes.caribe@cengage.com 

Cengage Learning Cono Sur clientes.conosur@cengage.com 

Cengage Learning Paraninfo clientes.paraninfo@cengage.com 

Cengage Learning Pacto Andino clientes.pactoandino@cengage.com 

Los recursos disponibles se encuentran en el sitio web del libro: 
http: //latinoamerica.cengage.com/devore 

Las direcciones de los sitios web referidas en el texto no son administradas por Cengage 
Learning Latinoamérica, por lo que ésta no es responsable de los cambios o actualizaciones 
de las mismas. 


Reconocimentos 

Mis colegas en Cal Poly me proporcionaron apoyo y retroalimentación invaluables durante 
el curso de los años. También agradezco a los muchos usuarios de ediciones previas que me 
sugirieron mejoras (y en ocasiones errores identificados). Una nota especial de agradecimien¬ 
to va para Matt Carlton por su trabajo en los dos manuales de soluciones, uno para profeso¬ 
res y el otro para estudiantes. Y me he beneficiado mucho de un diálogo que tuve con Doug 
Bates sobre el contenido, aun cuando no siempre he estado de acuerdo con sus muy preca¬ 
vidas sugerencias. 

La generosa retroalimentación provista por los siguientes revisores de ésta y previas 
ediciones, ha sido de mucha ayuda para mejorar el libro: Robert L. Armacost, University of 
Central Florida; Bill Bade, Lincoln Land Community College; Douglas M. Bates, Univer¬ 
sity of Wisconsin-Madison; Michael Berry, West Virginia Wesleyan College; Brian Bow- 
man, Auburn University; Linda Boyle, University of lowa; Ralph Bravaco, Stonehill 
College; Linfield C. Brown, Tufts University; Karen M. Bursic, University of Pittsburgh; 
Lynne Butler, Haverford College; Raj S. Chhikara, University of Houston-Clear Lake; Ed- 
win Chong, Colorado State University; David Clark, California State Polytechnic Univer¬ 
sity en Pomona; Ken Constantine, Taylor University; David M. Cresap, University of 
Portland; Savas Dayanik, Princeton University; Don E. Deal, University of Houston; Ann- 
janette M. Dodd, Humboldt State University; Jimmy Doi, California Polytechnic State Uni- 
versity-San Luis Obispo; Charles E. Donaghey, University of Houston; Patrick J. Driscoll, 
U.S. Military Academy; Mark Duva, University of Virginia; Nassir Eltinay, Lincoln Land 
Community College; Thomas English, College of the Mainland; Nasser S. Fard, Northeas- 
tern University; Ronald Fricker, Naval Postgraduate School; Steven T. Garren, James Madi- 
son University; Harland Glaz, University of Maryland; Ken Grace, Anoka-Ramsey 
Community College; Celso Grebogi, University of Maryland; Verónica Webster Griffis, Mi¬ 
chigan Technological University; José Guardiola, Texas A&M University-Corpus Christi; 
K.L.D. Gunawardena, University of Wisconsin-Oshkosh; James J. Halavin, Rochester 
Institute of Technology; James Hartman, Marymount University; Tyler Haynes, Saginaw 
Valley State University; Jennifer Hoeting, Colorado State University; Wei-Min Huang, 
Lehigh University; Roger W. Johnson, South Dakota School of Mines & Technology; Chih- 
wa Kao, Syracuse University; Saleem A. Kassam, University of Pennsylvania; Mohammad 
T. Khasawneh, State University of NewYork-Binghamton; Stephen Kokoska, Colgate Uni¬ 
versity; Sarah Lam, Binghamton University; M. Louise Lawson, Kennesaw State Univer¬ 
sity; Jialiang Li, University of Wisconsin-Madison; Wooi K. Lim, William Paterson 



















Prels pOOi-xvi.qxd 3/12/08 10:17 AM Page xvi 




University; Aquila Lipscomb, The Citadel; Manuel Lladser, University of Colorado en 
Boulder; Graham Lord, University of Califomia-Los Angeles; Joseph L. Macaluso, DeSales 
University; Ranjan Maitra, Iowa State University; David Mathiason, Rochester Institute of 
Technology; Arnold R. Miller, University of Denver; John J. Millson, University of Mary- 
land; Pamela Kay Miltenberger, West Virginia Wesleyan College; Monica Molsee, Portland 
State University; Thomas Moore, Naval Postgraduate School; Robert M. Norton, College of 
Charleston; Steven Pilnick, Naval Postgraduate School; Robi Polikar, Rowan University; 
Ernest Pyle, Houston Baptist University; Steve Rein, California Polytechnic State Uni- 
versity-San Luis Obispo; Tony Richardson, University of Evansville; Don Ridgeway, North 
Carolina State University; Larry J. Ringer, Texas A&M University; Robert M. Schumacher, Ce- 
darville University; Ron Schwartz, Florida Atlantic University; Kevan Shafizadeh, California 
State University-Sacramento; Robert K. Smidt, California Polytechnic State University-San 
Luis Obispo; Alice E. Smith, Auburn University; James MacGregor Smith, University of 
Massachusetts; Paul J. Smith, University of Maryland; Richard M. Soland, The George 
Washington University; Clifford Spiegelman, Texas A&M University; Jery Stedinger, Cor- 
nell University; David Steinberg, Tel Aviv University; William Thistleton, State University 
of New York Institute of Technology; G. Geoffrey Vining, University of Florida; Bhutan 
Wadhwa, Cleveland State University; Elaine Wenderholm, State University of New York- 
Oswego; Samuel P. Wilcock, Messiah College; Michael G. Zabetakis, University of Pitts- 
burgh y María Zack, Point Loma Nazarene University. 

Gracias a Merrill Peterson y sus colegas en Matrix Productions por hacer el proce¬ 
so de producción lo menos embarazoso posible. Una vez más me siento obligado a expresar 
mi gratitud a todas las personas que han hecho importantes contribuciones a lo largo de sie¬ 
te ediciones del libro. En particular, Carolyn Crockett ha sido tanto una editora de primera 
clase como una buena amiga. Jennifer Risden, Joseph Rogove, Ann Day, Elizabeth Gersh- 
man y Ashley Summers merecen una mención especial por sus recientes esfuerzos. También 
deseo extender mi aprecio a los cientos de representantes de ventas quienes durante los úl¬ 
timos 20 años han predicado hábilmente el evangelio sobre este libro y otros que he escri¬ 
to. Por último pero no menos importante, un sincero agradecimiento a mi esposa Carol por 
tolerar mi programa de trabajo y mis frecuentes y demasiadas quejas a lo largo de mi carre¬ 
ra de escritor. 


Jay Devore 




















r 


Generalidades y 
estadística descriptiva 


INTRODUCCIÓN 

Los conceptos y métodos estadísticos no son sólo útiles sino que con frecuencia son in¬ 
dispensables para entender el mundo que nos rodea. Proporcionan formas de obtener 
¡deas nuevas del comportamiento de muchos fenómenos que se presentarán en su 
campo de especialización escogido en ingeniería o ciencia. 

La disciplina de estadística nos enseña cómo realizar juicios inteligentes y tomar 
decisiones informadas entre la presencia de incertidumbre y variación. Sin incerti¬ 
dumbre y variación, habría poca necesidad de métodos estadísticos o de profesionales 
en estadística. Si cada componente de un tipo particular tuviera exactamente la mis¬ 
ma duración, si todos los resistores producidos por un fabricante tuvieran el mismo 
valor de resistencia, si las determinaciones del pH en muestras de suelo de un lugar 
particular dieran resultados idénticos, y así sucesivamente, entonces una sola obser¬ 
vación revelaría toda la información deseada. 

Una importante manifestación de variación surge en el curso de la medición de 
emisiones en vehículos automotores. Los requerimientos de costo y tiempo del Fede¬ 
ral Test Procedure (FTP, por sus siglas en inglés) impiden su uso generalizado en pro¬ 
gramas de inspección de vehículos. En consecuencia, muchas agencias han creado 
pruebas menos costosas y más rápidas, las que se espera reproduzcan los resultados 
obtenidos con el FTP. De acuerdo con el artículo "Motor Vehicle Emissions Variabi- 
lity" (y. of the Air and Waste Mgmt. Assoc., 1996: 667-675), la aceptación del FTP 
como patrón de oro ha llevado a la creencia ampliamente difundida de que las me¬ 
diciones repetidas en el mismo vehículo conducirían a resultados idénticos (o casi 
idénticos). Los autores del artículo aplicaron el FTP a siete vehículos caracterizados 
como "altos emisores". Fie aquí los resultados de uno de los vehículos. 

HC (g/milla) 13.8 18.3 32.2 32.5 

CO (g/milla) 118 149 232 236 
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CAPÍTULO 1 Generalidades y estadística descriptiva 

La variación sustancial en las mediciones tanto de HC como de CO proyecta una du¬ 
da considerable sobre la sabiduría convencional y hace mucho más difícil realizar eva¬ 
luaciones precisas sobre niveles de emisiones. 

¿Cómo se pueden utilizar técnicas estadísticas para reunir información y sacar 
conclusiones? Supóngase, por ejemplo, que un ingeniero de materiales inventó un re¬ 
cubrimiento para retardar la corrosión en tuberías de metal en circunstancias específi¬ 
cas. Si este recubrimiento se aplica a diferentes segmentos de la tubería, la variación de 
las condiciones ambientales y de los segmentos mismos producirá más corrosión sus¬ 
tancial en algunos segmentos que en otros. Se podría utilizar un análisis estadístico en 
datos de dicho experimento para decidir si la cantidad promedio de corrosión excede 
un límite superior especificado de alguna clase o para predecir cuánta corrosión ocu¬ 
rrirá en una sola pieza de tubería. 

Por otra parte, supóngase que el ingeniero inventó el recubrimiento con la creen¬ 
cia de que será superior al recubrimiento actualmente utilizado. Se podría realizar un 
experimento comparativo para investigar esta cuestión aplicando el recubrimiento ac¬ 
tual a algunos segmentos de la tubería y el nuevo a otros segmentos. Esto debe reali¬ 
zarse con cuidado o se obtendrá una conclusión errónea. Por ejemplo, tal vez la 
cantidad promedio de corrosión sea idéntica con los dos recubrimientos. Sin embargo, 
el recubrimiento nuevo puede ser aplicado a segmentos que tengan una resistencia su¬ 
perior a la corrosión y en condiciones ambientales severas en comparación con los seg¬ 
mentos y condiciones del recubrimiento actual. El investigador probablemente observaría 
entonces una diferencia entre los dos recubrimientos atribuibles no a los recubrimien¬ 
tos mismos, sino sólo a variaciones extrañas. La estadística ofrece no sólo métodos para 
analizar resultados de experimentos una vez que se han realizado sino también suge¬ 
rencias sobre cómo pueden realizarse los experimentos de una manera eficiente para 
mitigar los efectos de variación y tener una mejor oportunidad de llegar a conclusiones 
correctas. 



1.1 Poblaciones, muestras y procesos 

Los ingenieros y científicos constantemente están expuestos a la recolección de hechos o 
datos, tanto en sus actividades profesionales como en sus actividades diarias. La disciplina 
de estadística proporciona métodos de organizar y resumir datos y de sacar conclusiones ba¬ 
sadas en la información contenida en los datos. 

Una investigación típicamente se enfocará en una colección bien definida de objetos 
que constituyen una población de interés. En un estudio, la población podría consistir de 
todas las cápsulas de gelatina de un tipo particular producidas durante un periodo específi¬ 
co. Otra investigación podría implicar la población compuesta de todos los individuos que 
recibieron una licenciatura de ingeniería durante el año académico más reciente. Cuando la 
información deseada está disponible para todos los objetos de la población, se tiene lo que 
se llama un censo. Las restricciones de tiempo, dinero y otros recursos escasos casi siem¬ 
pre hacen que un censo sea impráctico o infactible. En su lugar, se selecciona un subcon¬ 
junto de la población, una muestra, de manera prescrita. Así pues, se podría obtener una 
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1.1 Poblaciones, muestras y procesos 3 

muestra de cojinetes de una corrida de producción particular como base para investigar si 
los cojinetes se ajustan a las especificaciones de fabricación, o se podría seleccionar una 
muestra de los graduados de ingeniería del último año para obtener retroalimentación sobre 
la calidad de los programas de estudio de ingeniería. 

Por lo general, existe interés sólo en ciertas características de los objetos en una po¬ 
blación: el número de grietas en la superficie de cada recubrimiento, el espesor de cada pa¬ 
red de cápsula, el género de un graduado de ingeniería, la edad a la cual el individuo se 
graduó, y así sucesivamente. Una característica puede ser categórica, tal como el género o 
tipo de funcionamiento defectuoso o puede ser de naturaleza numérica. En el primer caso, 
el valor de la característica es una categoría (p. ej., femenino o soldadura insuficiente), 
mientras que en el segundo caso, el valor es un número (p. ej., edad = 23 años o diámetro 
= 0.502 cm). Una variable es cualquier característica cuyo valor puede cambiar de un ob¬ 
jeto a otro en la población. Inicialmente las letras minúsculas del alfabeto denotarán las va¬ 
riables. Algunos ejemplos incluyen: 

x = marca de la calculadora de un estudiante 

y = número de visitas a un sitio web particular durante un periodo específico 

Z = distancia de frenado de un automóvil en condiciones específicas 

Se obtienen datos al observar o una sola variable o en forma simultánea dos o más varia¬ 
bles. Un conjunto de datos univariantes se compone de observaciones realizadas en una so¬ 
la variable. Por ejemplo, se podría determinar el tipo de transmisión automática (A) o 
manual (M) en cada uno de diez automóviles recientemente adquiridos en cierto concesio¬ 
nario y el resultado sería el siguiente conjunto de datos categóricos 

MAAAMAAMAA 

La siguiente muestra de duraciones (horas) de baterías D puestas en cierto uso es un con¬ 
junto de datos numéricos univariantes: 

5.6 5.1 6.2 6.0 5.8 6.5 5.8 5.5 

Se tienen datos bivariantes cuando se realizan observaciones en cada una de dos variables. 
El conjunto de datos podría consistir en un par (altura, peso) por cada jugador integrante del 
equipo de básquetbol, con la primera observación como (72, 168), la segunda como (75, 
212), y así sucesivamente. Si un ingeniero determina el valor tanto de x = componente de 
duración y y = razón de la falla del componente, el conjunto de datos resultante es bivarian- 
te con una variable numérica y la otra categórica. Los datos multivariantes surgen cuando 
se realizan observaciones en más de una variable (por lo que bivariante es un caso especial 
de multivariante). Por ejemplo, un médico investigador podría determinar la presión sanguí¬ 
nea sistólica, la presión sanguínea diastólica y nivel de colesterol en suero de cada pacien¬ 
te participante en un estudio. Cada observación sería un triple de números, tal como (120, 
80, 146). En muchos conjuntos de datos multivariantes, algunas variables son numéricas 
y otras son categóricas. Por lo tanto, el número anual dedicado al automóvil de Consumer 
Reports da valores de tales variables como tipo de vehículo (pequeño, deportivo, compacto, 
tamaño mediano, grande), eficiencia de consumo de combustible en la ciudad (mpg), efi¬ 
ciencia de consumo de combustible en carretera (mpg), tipo de tren motriz (ruedas traseras, 
ruedas delanteras, cuatro ruedas), etcétera. 


Ramas de la estadística 

Es posible que un investigador que ha recopilado datos desee resumir y describir caracterís¬ 
ticas importantes de los mismos. Esto implica utilizar métodos de estadística descriptiva. 
Algunos de ellos son de naturaleza gráfica; la construcción de histogramas, diagramas de 
caja y gráficas de puntos son ejemplos primordiales. Otros métodos descriptivos implican 
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4 CAPÍTULO 1 Generalidades y estadística descriptiva 

el cálculo de medidas numéricas, tales como medias, desviaciones estándar y coeficientes 
de correlación. La amplia disponibilidad de programas de computadora estadísticos han he¬ 
cho que estas tareas sean más fáciles de realizar de lo que antes eran. Las computadoras son 
mucho más eficientes que los seres humanos para calcular y crear imágenes (¡una vez que 
han recibido las instrucciones apropiadas del usuario!). Esto significa que el investigador no 
tiene que esforzarse mucho en el “trabajo tedioso” y tendrá más tiempo para estudiar los da¬ 
tos y extraer mensajes importantes. A lo largo de este libro, se presentarán los datos de sa¬ 
lida de varios paquetes tales como MINITAB, SAS, S-Plus y R. El programa R puede ser 
descargado sin cargo del sitio http://www.r-project.org. 

Ejemplo 1.1 La tragedia que sufrió el transbordador espacial Challenger y sus astronautas en 1986 con¬ 
dujo a varios estudios para investigar las razones de la falla de la misión. La atención se en¬ 
focó de inmediato en el comportamiento de los sellos anulares del motor del cohete. He aquí 
datos derivados de observaciones en x = temperatura del sello anular (°F) en cada encendi¬ 
do de prueba o lanzamiento del motor del cohete del transbordador ( Presidential Commis- 
sion on the Space Shuttle Challenger Accident, Yol. 1, 1986: 129-131). 
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Sin organización, es difícil tener una idea de cuál podría ser una temperatura típica o repre¬ 
sentativa, ya sea que los valores estén muy concentrados en torno a un valor típico o bastan¬ 
te esparcidos, ya sea que existan brechas en los datos, qué porcentaje de los valores están en 
los 60, y así sucesivamente. La figura 1.1 muestra lo que se conoce como gráfica de tallo y 
hojas de los datos, así como también un histograma. En breve, se discutirá la construcción 
e interpretación de estos resúmenes gráficos; por el momento se espera que se vea cómo es¬ 
tán distribuidos los valores de temperatura a lo largo de la escala de medición. Algunos de 
estos lanzamientos/encendidos fueron exitosos y otros fallaron. 



Tallo y hojas de temperatura N=36 
Unidad de hojas = 1.0 
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Figura 1.1 Una gráfica de tallo y hojas e histograma generados con MINITAB de los datos 
de temperatura de los sellos anulares. 






























cl_p001-045.qxd 


3/12/08 


2:31 AM Page 5 


Ejemplo 1.2 


e 



1.1 Poblaciones, muestras y procesos 5 

La temperatura más baja es de 31 grados, mucho más baja que la siguiente temperatura más 
baja y ésta es la observación en relación con el desastre del Challenger. La investigación 
presidencial descubrió que se requerían temperaturas calientes para la operación exitosa de 
los sellos anulares y que 31 grados eran demasiado frío. En el capítulo 13 se presentará una 
relación entre temperatura y la probabilidad de un lanzamiento exitoso. ■ 

Después de haber obtenido una muestra de una población, un investigador con fre¬ 
cuencia desearía utilizar la información muestral para sacar algún tipo de conclusión (hacer 
una inferencia de alguna clase) con respecto a la población. Es decir, la muestra es un me¬ 
dio para llegar a un fin en lugar de un fin por sí misma. Las técnicas para generalizar desde 
una muestra hasta una población se congregan dentro de la rama de la disciplina llamada es¬ 
tadística inferencial. 

Las investigaciones de resistencia de materiales constituyen una rica área de aplicación de 
métodos estadísticos. El artículo “Effects of Aggregates and Microfillers on the Flexural 
Properties of Concrete” ( Magazine of Concrete Research , 1997: 81-98) reportó sobre un es¬ 
tudio de propiedades de resistencia de concreto de alto desempeño obtenido con el uso de 
superplastificantes y ciertos aglomerantes. La resistencia a la compresión de dicho concre¬ 
to previamente había sido investigada, pero no se sabía mucho sobre la resistencia a la fle¬ 
xión (una medida de la capacidad de resistir fallas a flexión). Los datos anexos sobre 
resistencia a la flexión (en megapascales, MPa, donde 1 Pa (pascal) = 1.45 X 10 4 lb/pulg 2 ) 
aparecieron en el artículo citado: 

5.9 7.2 7.3 6.3 8.1 6.8 7.0 7.6 6.8 6.5 7.0 6.3 7.9 9.0 

8.2 8.7 7.8 9.7 7.4 7.7 9.7 7.8 7.7 11.6 11.3 11.8 10.7 

Supóngase que se desea estimar el valor promedio de resistencia a la flexión de todas las vi¬ 
gas que pudieran ser fabricadas de esta manera (si se conceptualiza una población de todas 
esas vigas, se trata de estimar la media poblacional). Se puede demostrar que, con un alto gra¬ 
do de confianza, la resistencia media de la población se encuentra entre 7.48 MPa y 8.80 MPa; 
esto se llama intervalo de confianza o estimación de intervalo. Alternativamente, se podrían 
utilizar estos datos para predecir la resistencia a la flexión de una sola viga de este tipo. Con 
un alto grado de confianza, la resistencia de una sola viga excederá de 7.35 MPa; el núme¬ 
ro 7.35 se conoce como límite de predicción inferior. ■ 

El objetivo principal de este libro es presentar e ilustrar métodos de estadística infe¬ 
rencial que son útiles en el trabajo científico. Los tipos más importantes de procedimientos 
inferenciales, estimación puntual, comprobación de hipótesis y estimación por medio de in¬ 
tervalos de frecuencia, se introducen en los capítulos 6 a 8 y luego se utilizan escenarios más 
complicados en los capítulos 9 a 16. El resto de este capítulo presenta métodos de estadís¬ 
tica descriptiva que se utilizan mucho en el desarrollo de inferencia. 

Los capítulos 2 a 5 presentan material de la disciplina de probabilidad. Este material 
finalmente tiende un puente entre las técnicas descriptivas e inferenciales. El dominio de la pro¬ 
babilidad permite entender mejor cómo se desarrollan y utilizan los procedimientos inferencia¬ 
les, cómo las conclusiones estadísticas pueden ser traducidas al lenguaje diario e interpretadas 
y cuándo y dónde pueden ocurrir errores al aplicar los métodos. La probabilidad y estadística se 
ocupan de cuestiones que implican poblaciones y muestras, pero lo hacen de una “manera in¬ 
versa” una con respecto a la otra. 

En un problema de probabilidad, se supone que las propiedades de la población estu¬ 
diada son conocidas (p. ej., en una población numérica, se puede suponer una cierta distri¬ 
bución específica de valores de la población) y se pueden plantear y responder preguntas 
con respecto a una muestra tomada de una población. En un problema de estadística, el ex¬ 
perimentador dispone de las características de una muestra y esta información le permite sa¬ 
car conclusiones con respecto a la población. La relación entre las dos disciplinas se resume 
diciendo que la probabilidad discurre de la población a la muestra (razonamiento deductivo). 
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Probabilidad 



inferencial 


Figura 1.2 Relación entre probabilidad y estadística inferencial. 

mientras que la estadística inferencial discurre de la muestra a la población (razonamiento 
inductivo). Esto se ilustra en la figura 1.2. 

Antes de que se pueda entender lo que una muestra particular pueda decir sobre la po¬ 
blación, primero se deberá entender la incertidumbre asociada con la toma de una muestra 
de una población dada. Por eso se estudia la probabilidad antes que la estadística. 

Como un ejemplo del enfoque contrastante de la probabilidad y la estadística inferen¬ 
cial, el uso que los conductores hacen de los cinturones de seguridad manuales de regazo 
en carros equipados con sistemas de cinturones de hombro automáticos. (El artículo “Auto¬ 
mobile Seat Belts: Usage Patterns in Automatic Belt Systems”, Human Factors, 1998: 
126-135, resume datos de uso.) Se podría suponer que probablemente 50% de todos los con¬ 
ductores de carros equipados de esta forma en cierta área metropolitana utilizan de manera 
regular su cinturón de regazo (una suposición sobre la población), así que se podría pregun¬ 
tar, “¿qué tan probable es que una muestra de 100 conductores incluirá por lo menos 70 que 
regularmente utilicen su cinturón de regazo?” o “¿cuántos de los conductores en una mues¬ 
tra de tamaño 100 se puede esperar que utilicen con regularidad su cinturón de regazo?” Por 
otra parte, en estadística inferencial se dispone de información sobre la muestra; por ejem¬ 
plo, una muestra de 100 conductores de tales vehículos reveló que 65 utilizan con regulari¬ 
dad su cinturón de regazo. Se podría entonces preguntar: “¿proporciona esto evidencia 
sustancial para concluir que más de 50% de todos los conductores en esta área utilizan con 
regularidad su cinturón de regazo?” En el último escenario, se intenta utilizar la informa¬ 
ción relativa a la muestra para responder una pregunta acerca de la estructura de toda la po¬ 
blación de la cual se seleccionó la muestra. 

En el ejemplo del cinturón de regazo, la población está bien definida y concreta: todos 
los conductores de carros equipados de una cierta manera en un área metropolitana particu¬ 
lar. En el ejemplo 1.1, sin embargo, una muestra de temperaturas de sello anular está dispo¬ 
nible, pero proviene de una población que en realidad no existe. En su lugar, conviene pensar 
en la población como compuesta de todas las posibles mediciones de temperatura que se po¬ 
drían hacer en condiciones experimentales similares. Tal población se conoce como pobla¬ 
ción conceptual o hipotética. Existen varias situaciones en las cuales las preguntas encajan 
en el marco de referencia de la estadística inferencial al conceptualizar una población. 

Estudios enumerativos contra analíticos 

W. E. Deming, estadístico estadounidense muy influyente quien fue una fuerza propulsora 
en la revolución de calidad de Japón durante las décadas de 1950 y 1960, introdujo la dis¬ 
tinción entre estudios enumerativos y estudios analíticos. En los primeros, el interés se en¬ 
foca en un conjunto de individuos u objetos finito, identificable y no cambiante que 
conforman una población. Un marco de maestreo , es decir, una lista de los individuos u ob¬ 
jetos que tienen que ser muestreados, está disponible para un investigador o puede ser cons¬ 
truida. Por ejemplo, el marco se podría componer de todas las firmas incluidas en una 
petición para calificar una cierta iniciativa para las boletas de votación en una elección próxi¬ 
ma; por lo general se elige una muestra para indagar si el número de firmas válidas sobre¬ 
pasa un valor especificado. Como otro ejemplo, el marco puede contener números de serie 
de todos los hornos fabricados por una compañía particular durante cierto periodo; se puede 
seleccionar una muestra para inferir algo sobre la duración promedio de estas unidades. El 
uso de métodos inferenciales presentados en este libro es razonablemente no controversial 
en tales escenarios (aun cuando los estadísticos continúan argumentando sobre qué métodos 
particulares deben ser utilizados). 
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1.1 Poblaciones, muestras y procesos 7 

Un estudio analítico se define ampliamente como uno que no es de naturaleza enume¬ 
rativa. Tales estudios a menudo se realizan con el objetivo de mejorar un producto futuro al 
actuar sobre un proceso de una cierta clase (p. ej., recalibrar equipo o ajustar el nivel de al¬ 
guna sustancia tal como la cantidad de un catalizador). A menudo se obtienen datos sólo 
sobre un proceso existente, uno que puede diferir en aspectos importantes del proceso futu¬ 
ro. No existe por lo tanto un marco de muestreo que enliste los individuos u objetos de in¬ 
terés. Por ejemplo, una muestra de cinco turbinas con un nuevo diseño puede ser fabricada 
y probada para investigar su eficiencia. Estas cinco podrían ser consideradas como una 
muestra de la población conceptual de todos los prototipos que podrían ser fabricados en 
condiciones similares, pero no necesariamente representativas de la población de las unida¬ 
des fabricadas una vez que la producción futura esté en proceso. Los métodos para utilizar 
la información sobre muestras para sacar conclusiones sobre unidades de producción futu¬ 
ras pueden ser problemáticos. Se deberá llamar a alguien con los conocimientos necesarios 
en el área del diseño e ingeniería de turbinas (o de cualquier otra área pertinente) para que 
juzgue si tal extrapolación es sensible. Una buena exposición de estos temas se encuentra 
en el artículo “Assumptions for Statistical Inference”, de Gerald Hahn y William Meeker 
(The American Statistician, 1993: 1-11). 


Recopilación de datos 

La estadística se ocupa no sólo de la organización y análisis de datos una vez que han sido 
recopilados sino también con el desarrollo de técnicas de recopilación de datos. Si éstos no 
son apropiadamente recopilados, un investigador no puede ser capaz de responder las pre¬ 
guntas consideradas con un razonable grado de confianza. Un problema común es que la po¬ 
blación objetivo, aquella sobre la cual se van a sacar conclusiones, puede ser diferente de la 
población realmente muestreada. Por ejemplo, a los publicistas les gustaría contar con va¬ 
rias clases de información sobre los hábitos de ver televisión de sus clientes potenciales. La 
información más sistemática de esta clase proviene de colocar dispositivos de monitoreo en 
un pequeño número de casas a través de Estados Unidos. Se ha conjeturado que la coloca¬ 
ción de semejantes dispositivos por sí misma modifica el comportamiento del televidente, 
de modo que las características de la muestra pueden ser diferentes de aquellas de la pobla¬ 
ción objetivo. 

Cuando la recopilación de datos implica seleccionar individuos u objetos de un mar¬ 
co, el método más simple para garantizar una selección representativa es tomar una mues¬ 
tra aleatoria simple. Ésta es una para la cual cualquier subconjunto particular del tamaño 
especificado (p. ej., una muestra de tamaño 100) tiene la misma oportunidad de ser selec¬ 
cionada. Por ejemplo, si el marco se compone de 1 000 000 de números de serie, los núme¬ 
ros 1,2, ..., hasta 1 000000 podrían ser anotados en trozos idénticos de papel. Después de 
colocarlos en una caja y mezclarlos perfectamente, se sacan uno por uno hasta que se ob¬ 
tenga el tamaño de muestra requisito. De manera alternativa (y mucho más preferible), se 
podría utilizar una tabla de números aleatorios o un generador de números aleatorios de 
computadora. 

En ocasiones se pueden utilizar métodos de muestreo alternativos para facilitar el pro¬ 
ceso de selección, a fin de obtener información extra o para incrementar el grado de con¬ 
fianza en conclusiones. Un método como ése, el muestreo estratificado, implica separar las 
unidades de la población en grupos no traslapantes y tomar una muestra de cada uno. Por 
ejemplo, un fabricante de reproductores de DVD podría desear información sobre la satis¬ 
facción del cliente para unidades producidas durante el año previo. Si tres modelos diferen¬ 
tes fueran fabricados y vendidos, se podría seleccionar una muestra distinta de cada uno de 
los estratos correspondientes. Esto daría información sobre los tres modelos y garantizaría 
que ningún modelo estuviera sobre o subrepresentado en toda la muestra. 

Con frecuencia, se obtiene una muestra de “conveniencia” seleccionando individuos u 
objetos sin aleatorización sistemática. Por ejemplo, un conjunto de ladrillos puede ser apilado 
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de tal modo que sea extremadamente difícil seleccionar a los que se encuentran en el cen¬ 
tro. Si los ladrillos localizados en la parte superior y a los lados de la pila fueran de algún 
modo diferentes a los demás, los datos muéstrales resultantes no representarían la pobla¬ 
ción. A menudo un investigador supondrá que tal muestra de conveniencia representa en for¬ 
ma aproximada una muestra aleatoria, en cuyo caso el repertorio de métodos inferenciales 
de un estadístico puede ser utilizado; sin embargo, ésta es una cuestión de criterio. La ma¬ 
yoría de los métodos aquí analizados se basan en una variación del muestreo aleatorio sim¬ 
ple descrito en el capítulo 5. 

Los ingenieros y científicos a menudo reúnen datos realizando alguna clase de expe¬ 
rimento. Esto puede implicar cómo asignar varios tratamientos diferentes (tales como ferti¬ 
lizantes o recubrimientos anticorrosivos) a las varias unidades experimentales (parcelas o 
tramos de tubería). Por otra parte, un investigador puede variar sistemáticamente los niveles 
o categorías de ciertos factores (p. ej., presión o tipo de material aislante) y observar el efec¬ 
to en alguna variable de respuesta (tal como rendimiento de un proceso de producción). 

Ejemplo 1.3 Un artículo en el New York Times (27 de enero de 1987) reportó que el riesgo de sufrir un 
ataque cardiaco podría ser reducido tomando aspirina. Esta conclusión se basó en un ex¬ 
perimento diseñado que incluía tanto un grupo de control de individuos que tomaron un 
placebo que tenía la apariencia de aspirina pero que se sabía era inerte y un grupo de tra¬ 
tamiento que tomó aspirina de acuerdo con un régimen específico. Los sujetos fueron 
asignados al azar a los grupos para protegerlos contra cualquier prejuicio de modo que se 
pudieran utilizar métodos basados en la probabilidad para analizar los datos. De los 
11 034 individuos en el grupo de control, 189 subsecuentemente experimentaron ataques 
cardiacos, mientras que sólo 104 de los 11 037 en el grupo de aspirina sufrieron un ata¬ 
que cardiaco. La tasa de incidencia de ataques cardiacos en el grupo de tratamiento fue de 
sólo aproximadamente la mitad de aquella en el grupo de control. Una posible explica¬ 
ción de este resultado es la variación de la probabilidad, que la aspirina en realidad no tie¬ 
ne el efecto deseado y la diferencia observada es sólo una variación típica del mismo 
modo que el lanzamiento al aire de dos monedas idénticas por lo general produciría dife¬ 
rente cantidad de águilas. No obstante, en este caso, los métodos inferenciales sugieren 
que la variación de la probabilidad por sí misma no puede explicar en forma adecuada la 
magnitud de la diferencia observada. ■ 

Ejemplo 1.4 Un ingeniero desea investigar los efectos tanto del tipo de adhesivo como del material con¬ 
ductor en la fuerza adhesiva cuando se monta un circuito integrado (CI) sobre cierto sustra¬ 
to. Se consideraron dos tipos de adhesivos y dos materiales conductores. Se realizaron dos 
observaciones por cada combinación de tipo de adhesivo/material conductor y se obtuvie¬ 
ron los datos anexos. 


Tipo de adhesivo 

Material conductor 

Fuerza de adhesión observada 

Promedio 

1 

1 

82, 77 

79.5 

1 

2 

75, 87 

81.0 

2 

1 

84, 80 

82.0 

2 

2 

78, 90 

84.0 


Las fuerzas adhesivas promedio resultantes se ilustran en la figura 1.3. Parece que el adhe¬ 
sivo tipo 2 mejora la fuerza adhesiva en comparación con el tipo 1 en aproximadamente la 
misma cantidad siempre que se utiliza uno de los materiales conductores, con la combina¬ 
ción 2, 2 como la mejor. De nuevo se pueden utilizar métodos inferenciales para juzgar si 
estos efectos son reales o simplemente se deben a la variación de la probabilidad. 

Supóngase además que se consideran dos tiempos de curado y también dos tipos de 
posrecubrimientos de los circuitos integrados. Existen entonces 2 • 2 • 2 • 2 = 16 combi¬ 
naciones de estos cuatro factores y es posible que el ingeniero no disponga de suficientes 
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Figura 1.3 Fuerzas de adhesión promedio en el ejemplo 1.4. 

recursos para hacer incluso una observación sencilla para cada una de estas combinaciones. 
En el capítulo 11 se verá cómo la selección cuidadosa de una fracción de estas posibilida¬ 
des usualmente dará la información deseada. ■ 


EJERCICIOS Sección 1.1 (1-9) 


1. Dé una posible muestra de tamaño 4 de cada una de las si¬ 
guientes poblaciones. 

a. Todos los periódicos publicados en Estados Unidos. 

b. Todas las compañías listadas en la Bolsa de Valores de 
Nueva York. 

c. Todos los estudiantes en su colegio o universidad. 

d. Todas las calificaciones promedio de los estudiantes en su 
colegio o universidad. 

2. Para cada una de las siguientes poblaciones hipotéticas, dé 
una muestra posible de tamaño 4. 

a. Todas las distancias que podrían resultar cuando usted lan¬ 
za un balón de fútbol americano. 

b. Las longitudes de las páginas de libros publicados de aquí 
a 5 años. 

c. Todas las mediciones de intensidades posibles de terremo¬ 
tos (escala de Richter) que pudieran registrarse en Califor¬ 
nia durante el siguiente año. 

d. Todos los posibles rendimientos (en gramos) de una cierta 
reacción química realizada en un laboratorio. 

3. Considere la población compuesta de todas las computadoras de 
una cierta marca y modelo y enfóquese en si una computadora 
necesita servicio mientras se encuentra dentro de la garantía. 

a. Plantee varias preguntas de probabilidad con base en la se¬ 
lección de 100 de esas computadoras. 

b. ¿Qué pregunta de estadística inferencial podría ser respondi¬ 
da determinando el número de dichas computadoras en una 
muestra de tamaño 100 que requieren servicio de garantía? 

4. a. Dé tres ejemplos diferentes de poblaciones concretas y tres 

ejemplos distintos de poblaciones hipotéticas, 
b. Por cada una de sus poblaciones concretas e hipotéticas, dé 
un ejemplo de una pregunta de probabilidad y un ejemplo 
de pregunta de estadística inferencial. 

5. Muchas universidades y colegios han instituido programas de 
instrucción suplementaria (IS), en los cuales un facilitador re¬ 
gularmente se reúne con un pequeño grupo de estudiantes 


inscritos en el curso para promover discusiones sobre el ma¬ 
terial incluido en el curso y mejorar el dominio de la materia. 
Suponga que los estudiantes inscritos en un largo curso de es¬ 
tadística (¿de qué más?) se dividen al azar en un grupo de 
control que no participará en la instrucción suplementaria y 
en un grupo de tratamiento que sí participará. Al final del cur¬ 
so, se determina la calificación total de cada estudiante en el 
curso. 

a. ¿Son las calificaciones del grupo IS una muestra de una 
población existente? De ser así, ¿cuál es? De no ser así, 
¿cuál es la población conceptual pertinente? 

b. ¿Cuál piensa que es la ventaja de dividir al azar a los es¬ 
tudiantes en los dos grupos en lugar de permitir que cada 
estudiante elija el grupo al que desea unirse? 

c. ¿Por qué los investigadores no pusieron a todos los estu¬ 
diantes en el grupo de tratamiento? Nota : El artículo 
(“Supplemental Instruction: An Effective Component of 
Student Affairs Programming”, J. of College Student De- 
vel., 1997:577-586) discute el análisis de datos de varios 
programas de instrucción suplementaria. 

6. El sistema de la Universidad Estatal de California (CSU, por 
sus siglas en inglés) consta de 23 terrenos universitarios, des¬ 
de la Estatal de San Diego en el sur hasta la Estatal Humboldt 
cerca de la frontera con Oregon. Un administrador de CSU 
desea hacer una inferencia sobre la distancia promedio entre 
la ciudad natal y sus terrenos universitarios. Describa y discuta 
diferentes métodos de muestreo, que pudieran ser empleados. 
¿Este sería un estudio enumerativo o un estudio analítico? 
Explique su razonamiento. 

7. Cierta ciudad se divide naturalmente en diez distritos. ¿Cómo 
podría seleccionar un valuador de bienes raíces una muestra 
de casas unifamiliares que pudiera ser utilizada como base 
para desarrollar una ecuación para predecir el valor estimado 
a partir de características tales como antigüedad, tamaño, nú¬ 
mero de baños, distancia a la escuela más cercana y así suce¬ 
sivamente? ¿El estudio es enumerativo o analítico? 
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8. La cantidad de flujo a través de una válvula solenoide en el 
sistema de control de emisiones de un automóvil es una ca¬ 
racterística importante. Se realizó un experimento para estu¬ 
diar cómo la velocidad de flujo dependía de tres factores: la 
longitud de la armadura, la fuerza del resorte y la profundidad 
de la bobina. Se eligieron dos niveles diferentes (alto y bajo) de 
cada factor y se realizó una sola observación del flujo por ca¬ 
da combinación de niveles. 

a. ¿De cuántas observaciones consistió el conjunto de datos 
resultante? 


b. ¿Este estudio es enumerativo o analítico? Explique su ra¬ 
zonamiento. 

9. En un famoso experimento realizado en 1882, Michelson y 
Newcomb obtuvieron 66 observaciones del tiempo que re¬ 
quería la luz para viajar entre dos lugares en Washington, 
D.C. Algunas de las mediciones (codificadas en cierta mane¬ 
ra) fueron, 31, 23, 32, 36, -2, 26, 27 y 31. 

a. ¿Por qué no son idénticas estas mediciones? 

b. ¿Es éste un estudio enumerativo? ¿Por qué sí o por qué 
no? 


1.2 Métodos pictóricos y tabulares 
en la estadística descriptiva 

La estadística descriptiva se divide en dos temas generales. En esta sección, se considera la 
representación de un conjunto de datos por medio de técnicas visuales. En las secciones 1.3 
y 1.4, se desarrollarán algunas medidas numéricas para conjuntos de datos. Es posible que 
usted ya conozca muchas técnicas visuales; tablas de frecuencia, hojas de contabilidad, his- 
togramas, gráficas de pastel, gráficas de barras, diagramas de puntos y similares. Aquí se se¬ 
leccionan algunas de estas técnicas que son más útiles y pertinentes a la estadística de 
probabilidad e inferencial. 

Notación 

Alguna notación general facilitará la aplicación de métodos y fórmulas a una amplia varie¬ 
dad de problemas prácticos. El número de observaciones en una muestra única, es decir, el 
tamaño de muestra, a menudo será denotado por n, de modo que n = 4 para la muestra de 
universidades {Stanford, Iowa State, Wyoming, Rochester} y también para la muestra 
de lecturas de pH {6.3, 6.2, 5.9, 6.5}. Si se consideran dos muestras al mismo tiempo, m y 
n o n l y n 2 se pueden utilizar para denotar los números de observaciones. Por lo tanto, si 
{29.7, 31.6, 30.9} y {28.7, 29.5, 29.4, 30.3} son lecturas de eficiencia térmica de dos tipos 
diferentes de motores diesel, entonces m = 3 y n = 4. 

Dado un conjunto de datos compuesto de n observaciones de alguna variable x, enton¬ 
ces jcj, x 2 , x 3 , . . . , x n denotarán las observaciones individuales. El subíndice no guarda nin¬ 
guna relación con la magnitud de una observación particular. Por lo tanto, x¡ en general no 
será la observación más pequeña del conjunto, ni x n será la más grande. En muchas aplica¬ 
ciones, x¡ será la primera observación realizada por el experimentador, x 2 la segunda, y así 
sucesivamente. La observación í-ésima del conjunto de datos será denotada por x¡. 

Gráficas de tallos y hojas 

Considérese un conjunto de datos numéricos jt¡, x 2 , , x n para el cual x¡ se compone de 

por lo menos dos dígitos. Una forma rápida de obtener la representación visual informativa 
del conjunto de datos es construir una gráfica de tallos y hojas. 


Pasos para construir una gráfica de tallos y hojas 

1. Seleccione uno o más de los primeros dígitos para los valores de tallo. Los segun¬ 
dos dígitos se convierten en hojas. 

2. Enumere los posibles valores de tallos en una columna vertical. 

3. Anote la hoja para cada observación junto al valor de tallo. 

4. Indique las unidades para tallos y hojas en algún lugar de la gráfica. 
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Ejemplo 1.5 
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Si el conjunto de datos se compone de calificaciones de exámenes, cada uno entre 0 y 100, 
la calificación de 83 tendría un tallo de 8 y una hoja de 3. Para un conjunto de datos de efi¬ 
ciencias de consumo de combustible de automóviles (mpg), todas entre 8.1 y 47.8, se po¬ 
drían utilizar como el tallo, así que 32.6 tendría entonces una hoja de 2.6. En general, se 
recomienda una gráfica basada en tallos entre 5 y 20. 


El consumo de alcohol por parte de estudiantes universitarios preocupa no sólo a la comu¬ 
nidad académica sino también, a causa de consecuencias potenciales de salud y seguridad, 
a la sociedad en su conjunto. El artículo (“Health and Behavioral Consequences of Binge 
Drinking in College”, J. of the Amer. Med. Assoc., 1994: 1672-1677) presentó un amplio es¬ 
tudio sobre el consumo excesivo de alcohol en universidades a través de Estados Unidos. 
Un episodio de parranda se definió como cinco o más tragos en fila para varones y cuatro o 
más para mujeres. La figura 1.4 muestra una gráfica de tallo y hojas de 140 valores de x = 
porcentaje de edades de los estudiantes de licenciatura bebedores. (Estos valores no apare¬ 
cieron en el artículo citado, pero la gráfica concuerda con una gráfica de los datos que sí lo 
hicieron.) 


0 

1 

2 

3 

4 

5 

6 


4 

1345678889 

1223456666777889999 

0112233344555666677777888899999 

111222223344445566666677788888999 

00111222233455666667777888899 

01111244455666778 


Tallo: dígitos de diez cifras 
Hojas: dígitos de una cifra 


Figura 1.4 Gráfica de tallo y hojas de porcentajes de bebedores en cada una de 140 universidades. 


La primera hoja de la fila 2 del tallo es 1, la cual dice que 21% de los estudiantes de 
una de las universidades de la muestra eran bebedores. Sin la identificación de los dígitos 
en los tallos y los dígitos en las hojas, no se sabría si la observación correspondiente al ta¬ 
llo 2, hoja 1 debería leerse como 21%, 2.1% o 0.21 por ciento. 

Cuando se crea una imagen a mano, la ordenación de las hojas de la más pequeña a 
la más grande en cada línea puede ser tediosa. Esta ordenación contribuye poco si no se dis¬ 
pone de información adicional. Supóngase que las observaciones hubieran sido puestas en 
lista en orden alfabético por nombre de la escuela, como 

16% 33% 64% 37% 31% ... 

Entonces la colocación de estos valores en la gráfica en este orden haría que la fila 1 del ta¬ 
llo tuviera 6 como su primera hoja y el principio de la fila 3 del tallo sería 

3 | 371 . . . 

La gráfica sugiere que un valor típico o representativo se encuentra en la fila 4 del ta¬ 
llo, tal vez en el rango medio de 40%. Las observaciones no aparecen muy concentradas en 
torno a este valor típico, como sería el caso si todos los valores estuvieran entre 20 y 49%. 
Esta gráfica se eleva a una sola cresta a medida que desciende, y luego declina; no hay bre¬ 
chas en la gráfica. La forma de la gráfica no es perfectamente simétrica, pero en su lugar pa¬ 
rece alargarse un poco más en la dirección de las hojas bajas que en la dirección de las hojas 
altas. Por último, no existen observaciones que se alejen inusualmente del grueso de los da¬ 
tos (ningunos valores apartados ), como sería el caso si uno de los valores de 26% hubiera 
sido de 86%. La característica más sobresaliente de estos datos es que, en la mayoría de las 
universidades de la muestra, por lo menos una cuarta parte de los estudiantes son bebedo¬ 
res. El problema de beber en exceso en las universidades es mucho más extenso de lo que 
muchos hubieran sospechado. ■ 
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Una gráfica de tallos y hojas da información sobre los siguientes aspectos de los datos: 

• Identificación de un valor típico o representativo. 

• Grado de dispersión en torno al valor típico. 

• Presencia de brechas en los datos. 

• Grado de simetría en la distribución de los valores. 

• Número y localización de crestas. 

• Presencia de valores afuera de la gráfica. 

Ejemplo 1.6 La figura 1.5 presenta gráficas de tallos y hojas de una muestra aleatoria de longitudes de 
campos de golf (yardas) designados por Golf Magcizine como los más desafiantes en Esta¬ 
dos Unidos. Entre la muestra de 40 campos, el más corto es de 6 433 yardas de largo y 
el más largo es de 7 280 yardas. Las longitudes parecen estar distribuidas de una manera 
aproximadamente uniforme dentro del rango de valores presentes en la muestra. Obsérvese 
que la selección de tallo en este caso de un solo dígito (6 ó 7) o de tres (643, . . . , 728) pro¬ 
duciría una gráfica no informativa, primero a causa de pocos tallos y segundo a causa de de¬ 
masiados. 

Los programas de computadora de estadística en general no producen gráficas con ta¬ 
llos de dígitos múltiples. La gráfica MINITAB que aparece en la figura 1.5(b) resulta de 
truncar cada observación al borrar los dígitos uno. 


64 

35 

64 

33 

70 

Tallo: dígitos de miles y cientos de cifras 

Tallo y hojas de 

yardaj e 

N = 40 

65 

26 

27 

06 

83 

Hojas: dígitos de decenas de cifras y una cifra 

Unidad de hojas = 

10 


66 

05 

94 

14 




4 

64 

3367 

67 

90 

70 

00 

98 

70 
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8 

11 

65 

66 

0228 
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68 

90 

70 

73 

50 



18 

67 

0147799 

69 

00 

27 

36 

04 



(4) 

68 

5779 

70 

51 

05 

11 

40 

50 

22 

18 

69 
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71 

31 

69 

68 

05 

13 

65 

14 

8 

70 

71 

012455 

013666 

72 

80 

09 





2 

72 

08 


Figura 1.5 Gráficas de tallo y hojas de yardajes de campos de golf: a) hojas de dos dígitos; 
b) gráfica generada por MINITAB con las hojas de un dígito truncadas. ■ 



Gráficas de puntos 

Una gráfica de puntos es un resumen atractivo de datos numéricos cuando el conjunto de 
datos es razonablemente pequeño o existen pocos valores de datos distintos. Cada observa¬ 
ción está representada por un punto sobre la ubicación correspondiente en una escala de me¬ 
dición horizontal. Cuando un valor ocurre más de una vez, existe un punto por cada 
ocurrencia y estos puntos se apilan verticalmente. Como con la gráfica de tallos y hojas, una 
gráfica de puntos da información sobre la localización, dispersión, extremos y brechas. 

Ejemplo 1 La figura 1.6 muestra una gráfica de puntos para los datos de temperatura de los sellos anu¬ 
lares introducidos en el ejemplo 1.1 en la sección previa. Un valor de temperatura represen¬ 
tativo es uno que se encuentra entre la mitad de los 60 (°F) y existe poca dispersión en torno 
al centro. Los datos se alargan más en el extremo inferior que en el superior y la observa¬ 
ción más pequeña, 31, apenas puede ser descrita como valor extremo. 
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30 


40 




Temperatura 


Figura 1.6 Gráfica de puntos de los datos de temperatura de los sellos anulares (°F). ■ 


Si el conjunto de datos del ejemplo 1.7 hubieran consistido en 50 o 100 observacio¬ 
nes de temperatura, cada una registrada a un décimo de grado, habría sido muy tedioso cons¬ 
truir una gráfica de puntos. La técnica siguiente es muy adecuada a situaciones como esas. 

Histogramas 

Algunos datos numéricos se obtienen contando para determinar el valor de una variable (el 
número de citatorios de tráfico que una persona recibió durante el año pasado, el número de 
personas que solicitan empleo durante un periodo particular), mientras que otros datos se 
obtienen tomando mediciones (peso de un individuo, tiempo de reacción a un estímulo par¬ 
ticular). La prescripción para trazar un histograma es en general diferente en estos dos 
casos. 




DEFINICIÓN 


Una variable numérica es discreta si su conjunto de valores posibles es finito o se 
puede enumerar en una sucesión infinita (una en la cual existe un primer número, un 
segundo número, y así sucesivamente). Una variable numérica es continua si sus va¬ 
lores posibles abarcan un intervalo completo sobre la línea de números. 


O 


Una variable discreta x casi siempre resulta de contar, en cuyo caso posibles valores 
son 0, 1, 2, 3, ... o algún subconjunto de estos enteros. De la toma de mediciones surgen 
variables continuas. Por ejemplo, si x es el pH de una sustancia química, entonces en teoría 
x podría ser cualquier número entre 0 y 14: 7.0, 7.03, 7.032 y así sucesivamente. Desde lue¬ 
go, en la práctica existen limitaciones en el grado de precisión de cualquier instrumento de 
medición, por lo que es posible que no se pueda determinar el pH, el tiempo de reacción, la 
altura y la concentración con un número arbitrariamente grande de decimales. Sin embargo, 
desde el punto de vista de crear modelos matemáticos de distribuciones de datos, conviene 
imaginar un conjunto completo continuo de valores posibles. 

Considérense datos compuestos de observaciones de una variable discreta x. La fre¬ 
cuencia de cualquier valor x particular es el número de veces que ocurre un valor en el con¬ 
junto de datos. La frecuencia relativa de un valor es la fracción o proporción de veces que 
ocurre el valor: 


frecuencia relativa de un valor = 


número de veces que ocurre el valor 
número de observaciones en el conjunto de datos 


Supóngase, por ejemplo, que el conjunto de datos se compone de 200 observaciones de x = 
el número de cursos que un estudiante está tomando en este semestre. Si 70 de estos valo¬ 
res x es 3, entonces 


frecuencia del valor 3 de x: 70 

70 

frecuencia relativa del valor 3 de x: = 0.35 

Si se multiplica una frecuencia relativa por 100 se obtiene un porcentaje en el ejemplo de 
cursos universitarios, 35% de los estudiantes de la muestra están tomando tres cursos. Las 
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14 CAPÍTULO 1 Generalidades y estadística descriptiva 

frecuencias relativas, o porcentajes, por lo general interesan más que las frecuencias mis¬ 
mas. En teoría, las frecuencias relativas deberán sumar 1, pero en la práctica la suma puede 
diferir un poco de 1 por el redondeo. Una distribución de frecuencia es una tabla de las 
frecuencias o de las frecuencias relativas, o de ambas. 


Construcción de un histograma para datos discretos 

En primer lugar, se determina la frecuencia y la frecuencia relativa de cada valor x. 
Luego se marcan los valores x posibles en una escala horizontal. Sobre cada valor, se 
traza un rectángulo cuya altura es la frecuencia relativa (o alternativamente, la fre¬ 
cuencia) de dicho valor. 


Esta construcción garantiza que el área de cada rectángulo es proporcional a la frecuencia 
relativa del valor. Por lo tanto, si las frecuencias relativas de jc = I y x = 5 son 0.35 y 0.07, 
respectivamente, entonces el área del rectángulo sobre 1 es cinco veces el área del rectán¬ 
gulo sobre 5. 

Ejemplo 1.8 ¿Qué tan inusual es un juego de béisbol sin hit o de un hit en las ligas mayores y cuán fre¬ 
cuentemente un equipo pega más de 10, 15 o incluso 20 hits? La tabla 1.1 es una distribu¬ 
ción de frecuencia del número de hits por equipo por juego de todos los juegos de nueve 
episodios que se jugaron entre 1989 y 1993. 


Tabla 1.1 Distribución de frecuencia de hits en juegos de nueve episodios 


Hits/juego 

Número de 
juegos 

Frecuencia 

relativa 

Hits/juego 

Número de 
juegos 

Frecuencia 

relativa 

0 

20 

0.0010 

14 

569 

0.0294 

1 

72 

0.0037 

15 

393 

0.0203 

2 

209 

0.0108 

16 

253 

0.0131 

3 

527 

0.0272 

17 

171 

0.0088 

4 

1048 

0.0541 

18 

97 

0.0050 

5 

1457 

0.0752 

19 

53 

0.0027 

6 

1988 

0.1026 

20 

31 

0.0016 

7 

2256 

0.1164 

21 

19 

0.0010 

8 

2403 

0.1240 

22 

13 

0.0007 

9 

2256 

0.1164 

23 

5 

0.0003 

10 

1967 

0.1015 

24 

1 

0.0001 

11 

1509 

0.0779 

25 

0 

0.0000 

12 

1230 

0.0635 

26 

1 

0.0001 

13 

834 

0.0430 

27 

1 

0.0001 





19383 

1.0005 


El histograma correspondiente en la figura 1.7 se eleva suavemente hasta una sola 
cresta y luego declina. El histograma se extiende un poco más hacia la derecha (hacia valo¬ 
res grandes) que hacia la izquierda, un poco “asimétrico positivo”. 

O con la información tabulada o con el histograma mismo, se puede determinar lo si¬ 
guiente: 

frecuencia frecuencia frecuencia 
proporción de juegos = relativa + relativa + relativa 
a lo sumo de dos hits de x = 0 de x = 1 de x = 2 

= 0.0010 + 0.0037 + 0.0108 = 0.0155 
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1.2 Métodos pictóricos y tabulares en la estadística descriptiva 15 


Frecuencia relativa 




Asimismo, 


proporción de juegos con 
entre 5 y 10 hits (inclusive) 


= 0.0752 + 0.1026 + ■ ■ • + 0.1015 = 0.6361 


Esto es, aproximadamente 64% de todos estos juegos fueron de entre 5 y 10 hits (inclu¬ 
sive). ■ 


La construcción de un histograma para datos continuos (mediciones) implica subdivi¬ 
dir el eje de medición en un número adecuado de intervalos de clase o clases, de tal suer¬ 
te que cada observación quede contenida en exactamente una clase. Supóngase, por 
ejemplo, que se hacen 50 observaciones de x = eficiencia de consumo de combustible de 
un automóvil (mpg), la más pequeña de las cuales es 27.8 y la más grande 31.4. Entonces 
se podrían utilizar los límites de clase 27.5, 28.0, 28.5, . . . , y 31.5 como se muestra a con¬ 
tinuación: 



27.5 28.0 28.5 29.0 29.5 30.0 30.5 31.0 31.5 

Una dificultad potencial es que de vez en cuando una observación está en un límite de cla¬ 
se así que por consiguiente no cae en exactamente un intervalo, por ejemplo, 29.0. Una for¬ 
ma de habérselas con este problema es utilizar límites como 27.55, 28.05, . . . , 31.55. 
La adición de centésimas a los límites de clase evita que las observaciones queden en los lí¬ 
mites resultantes. Otro método es utilizar las clases 27.5-<28.0, 28.0-<28.5, . . . , 
31.0—<31.5. En ese caso 29.0 queda en la clase 29.0-<29.5 y no en la clase 28.5-<29.0. En 
otras palabras, con esta convención, una observación que queda en el límite se coloca en el 
intervalo a la derecha del mismo. Así es como M1NITAB construye un histograma. 


Construcción de un histograma para datos continuos: anchos de clase iguales 

Se determina la frecuencia y la frecuencia relativa de cada clase. Se marcan los 
límites de clase sobre un eje de medición horizontal. Sobre cada intervalo de cla¬ 
se, se traza un rectángulo cuya altura es la frecuencia relativa correspondiente (o 
frecuencia). 
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16 CAPÍTULO 1 Generalidades y estadística descriptiva 

Ejemplo 1.9 Las compañías eléctricas requieren información sobre el consumo de los clientes para obte¬ 
ner pronósticos precisos de demandas. Investigadores de Wisconsin Power and Light deter¬ 
minaron el consumo de energía (BTU) durante un periodo particular con una muestra de 90 
hogares calentados con gas. Se calculó un valor de consumo promedio como sigue: 

consumo 

consumo ajustado = - 

(clima, en grados días)(área de casa) 

Esto dio por resultado los datos anexos (una parte del conjunto de datos guardados FUR- 
NACE.MTW disponible en MINITAB, el cual se ordenó desde el valor más pequeño al más 
grande). 


2.97 

4.00 

5.20 

5.56 

5.94 

5.98 

6.35 

6.62 

6.72 

6.78 

6.80 

6.85 

6.94 

7.15 

7.16 

7.23 

7.29 

7.62 

7.62 

7.69 

7.73 

7.87 

7.93 

8.00 

8.26 

8.29 

8.37 

8.47 

8.54 

8.58 

8.61 

8.67 

8.69 

8.81 

9.07 

9.27 

9.37 

9.43 

9.52 

9.58 

9.60 

9.76 

9.82 

9.83 

9.83 

9.84 

9.96 

10.04 

10.21 

10.28 

10.28 

10.30 

10.35 

10.36 

10.40 

10.49 

10.50 

10.64 

10.95 

11.09 

11.12 

11.21 

11.29 

11.43 

11.62 

11.70 

11.70 

12.16 

12.19 

12.28 

12.31 

12.62 

12.69 

12.71 

12.91 

12.92 

13.11 

13.38 

13.42 

13.43 

13.47 

13.60 

13.96 

14.24 

14.35 

15.12 

15.24 

16.06 

16.90 

18.26 



Se permite que MINITAB seleccione los intervalos de clase. La característica del histogra- 
ma en la figura 1.8 que más llama la atención es su parecido a una curva en forma de cam¬ 
pana (y por consiguiente simétrico), con el punto de simetría aproximadamente en 10. 



Frecuencia 

l-<3 3-<5 

5-<7 

7-<9 

9—< 11 

11—< 13 

13—< 15 

15—< 17 

17—< 19 

de clase 

1 1 

11 

21 

25 

17 

9 

4 

1 

Frecuencia 

relativa 

0.011 0.011 

0.122 

0.233 

0.278 

0.189 

0.100 

0.044 

0.011 



BTU 

Figura 1.8 Histograma de los datos de consumo de energía del ejemplo 1.9. 


De acuerdo con el histograma, 
proporción de 

T.A 

observaciones ~ 0.01 + 0.01 + 0.12 + 0.23 = 0.37 (valor exacto = qq = 0.378) 
menor que 9 






































cl_p001-045.qxd 


2:31 AM Page 17 


3/12/08 



1.2 Métodos pictóricos y tabulares en la estadística descriptiva 17 


La frecuencia relativa para la clase 9-<ll es aproximadamente 0.27, así que se estima que 
en forma aproximada la mitad de ésta, o 0.135, queda entre 9 y 10. Por lo tanto 


proporción de observaciones 
menores que 10 


~ 0.37 + 0.135 = 0.505 (poco más de 50%) 


El valor exacto de esta proporción es 47/90 = 0.522 


No existen reglas inviolables en cuanto al número de clases o la selección de las mis¬ 
mas. Entre 5 y 20 serán satisfactorias para la mayoría de los conjuntos de datos. En gene¬ 
ral, mientras más grande es el número de observaciones en un conjunto de datos, más clases 
deberán ser utilizadas. Una razonable regla empírica es 


número de clases ~ Vnúmero de observaciones 


Es posible que las clases de ancho-igual no sean una opción sensible si un conjunto 
de datos “se alarga” hacia un lado o el otro. La figura 1.9 muestra una curva de puntos de 
dicho conjunto de datos. Con un pequeño número de clases de ancho-igual casi todas las ob¬ 
servaciones quedan en exactamente una o dos de las clases. Si se utiliza un gran número de 
clases de ancho-igual las frecuencias de muchas clases será cero. Una buena opción es uti¬ 
lizar algunos intervalos más anchos cerca de las observaciones extremas y más angostos en 
la región de alta concentración. 



M _L J . 






5- , , 


1 1 -É 


II II 



Figura 1.9 Selección de intervalos de clase para un conjunto "alargado" de puntos: a) interva¬ 
los angostos de ancho igual; b) intervalos amplios de ancho igual; c) intervalos de anchos dife¬ 
rentes. 


Construcción de un histograma para datos continuos: anchos de clase desiguales 

Después de determinar las frecuencias y las frecuencias relativas, se calcula la altura 
de cada rectángulo con la fórmula 

, , , , frecuencia relativa de la clase 

altura del rectángulo = - 

ancho de clase 

Las alturas del rectángulo resultante en general se conocen como densidades y la es¬ 
cala vertical es la escala de densidades. Esta prescripción también funcionará cuan¬ 
do los anchos de clase son iguales. 


Ejemplo 1.10 La corrosión del acero de refuerzo es un problema serio en estructuras de concreto localiza¬ 
das en ambientes afectados por condiciones climáticas severas. Por esa razón, los investiga¬ 
dores han estado estudiando el uso de barras de refuerzo hechas de un material compuesto. 
Se realizó un estudio para desarrollar indicaciones para adherir barras de refuerzo reforzadas 
con fibra de vidrio a concreto (“Design Recommendations for Bond of GFRP Rebars to Con¬ 
crete”, J. of Structural Engr., 1996: 247-254). Considérense las siguientes 48 observaciones 
de fuerza adhesiva medida: 
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11.5 

5.7 

3.6 

5.2 

12.1 9.9 

5.4 5.2 

3.4 20.6 

5.5 5.1 

9.3 7.8 

5.1 4.9 

25.5 13.8 

5.0 5.2 

6.2 

10.7 

12.6 

4.8 

6.6 7.0 
15.2 8.5 
13.1 8.9 
4.1 3.8 

13.4 17.1 

4.2 4.0 

8.2 10.7 

3.7 3.6 

9.3 5.6 

3.9 3.8 

14.2 7.6 

3.6 3.6 

Frecuencia 

2-<4 

4-<6 


6-<8 

8—<12 

12-<20 

20-<30 

de clase 

9 

15 


5 

9 

8 

2 

Frecuencia 

relativa 

0.1875 

0.3125 


0.1042 

0.1875 

0.1667 

0.0417 

Densidad 

0.094 

0.156 


0.052 

0.047 

0.021 

0.004 


El histograma resultante aparece en la figura 1.10. La cola derecha o superior se alarga mu¬ 
cho más que la izquierda o inferior, un sustancial alejamiento de la simetría. 



2 4 6 8 12 20 30 

Fuerza adhesiva 

Figura 1.10 Un histograma de densidad generado por MINITAB de los datos de fuerza adhesi¬ 
va del ejemplo 1.10. ■ 

Cuando los anchos de clase son desiguales, si no se utiliza una escala de densidad se 
obtendrá una gráfica con áreas distorsionadas. Con anchos de clase iguales, el divisor es el 
mismo en cada cálculo de densidad y la aritmética adicional simplemente implica reescalar 
el eje vertical (es decir, el histograma que utiliza frecuencia relativa y el que utiliza densi¬ 
dad tendrán exactamente la misma apariencia). Un histograma de densidad tiene una pro¬ 
piedad interesante. Si se multiplican ambos miembros de la fórmula para densidad por el 
ancho de clase se obtiene 

frecuencia relativa = (ancho de clasej(densidad) 

= (ancho del rectángulo)(altura del rectángulo) = área del rectángulo 

Es decir, el área de cada rectángulo es la frecuencia relativa de la clase correspondiente. 
Además, como la suma de frecuencias relativas debe ser 1, el área total de todos los rectán¬ 
gulos en un histograma de densidad es 1. Siempre es posible trazar un histograma de modo 
que el área sea igual a la frecuencia relativa (esto es cierto también para un histograma de 
datos discretos), simplemente se utiliza la escala de densidad. Esta propiedad desempeñará 
un importante papel al crear modelos de distribución en el capítulo 4. 

Formas de histograma 

Los histogramas se presentan en varias formas. Un histograma unimodal es el que se eleva a 
una sola cresta y luego declina. Uno bimodal tiene dos crestas diferentes. Puede ocurrir bimo- 
dalidad cuando el conjunto de datos se compone de observaciones de dos clases bastante dife¬ 
rentes de individuos u objetos. Por ejemplo, considérese un gran conjunto de datos compuesto 
de tiempos de manejo de automóviles que viajan entre San Luis Obispo, California 
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1.2 Métodos pictóricos y tabulares en la estadística descriptiva 19 

y Monterey, California (sin contar el tiempo utilizado para ver puntos de interés, comer, 
etc.). Este histograma mostraría dos crestas, una para los carros que toman la ruta interior 
(aproximadamente 2.5 horas) y otra para los carros que viajan a lo largo de la costa (3.5-4 
horas). Sin embargo, la bimodalidad no se presenta automáticamente en dichas situaciones. 
Sólo si los dos histogramas distintos están “muy alejados” en forma relativa con respecto a sus 
esparcimientos la bimodalidad ocurrirá en el histograma de datos combinados. Por consi¬ 
guiente un conjunto de datos grande compuesto de estaturas de estudiantes universitarios no 
producirá un histograma bimodal porque la altura típica de hombres de aproximadamente 
69 pulgadas no está demasiado por encima de la altura típica de mujeres de aproximada¬ 
mente 64-65 pulgadas. Se dice que un histograma con más de dos crestas es multimodal. 
Por supuesto, el número de crestas dependerá de la selección de intervalos de clase, en par¬ 
ticular, con un pequeño número de observaciones. Mientras más grande es el número de 
clases, es más probable que se manifieste bimodalidad o multimodalidad. 

Un histograma es simétrico si la mitad izquierda es una imagen de espejo de la mi¬ 
tad derecha. Un histograma bimodal es positivamente asimétrico si la cola derecha o 
superior se alarga en comparación con la cola izquierda o inferior y negativamente asimé¬ 
trico si el alargamiento es hacia la izquierda. La figura 1.11 muestra histogramas “alisados” 
obtenidos superponiendo una curva alisada sobre los rectángulos, que ilustran varias posi¬ 
bilidades. 



Datos cualitativos 


Tanto una distribución de frecuencia y un histograma pueden ser construidos cuando el conjun¬ 
to de datos es de naturaleza cualitativa (categórico). En algunos casos, habrá un ordenamiento 
natural de las clases, por ejemplo, estudiantes de primer año, segundo, tercero, cuarto y gra¬ 
duados, mientras que en otros casos el orden será arbitrario, por ejemplo, católico, judío, pro¬ 
testante, etc. Con esos datos categóricos, los intervalos sobre los que se construyen rectángulos 
deberán ser de igual ancho. 

Ejemplo 1.11 El Public Policy Institute of California realizó una encuesta telefónica de 2501 residentes adul¬ 
tos en California durante abril de 2006 para indagar qué pensaban sobre varios aspectos de la 
educación pública K-12. Una pregunta fue “En general, ¿cómo calificaría la calidad de las es¬ 
cuelas públicas de su vecindario hoy en día? La tabla 1.2 muestra las frecuencias y las frecuen¬ 
cias relativas y la figura 1.12 muestra el histograma correspondiente (gráfica de barras). 

Tabla 1.2 Distribución de frecuencia de calificaciones escolares 


Calificación 

Frecuencia 

Frecuencia relativa 

A 

478 

0.191 

B 

893 

0.357 

C 

680 

0.272 

D 

178 

0.071 

F 

100 

0.040 

Desconocida 

172 

0.069 


2501 

1.000 
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20 CAPÍTULO 1 Generalidades y estadística descriptiva 


Gráfica de frecuencia relativa vs calificación 



Calificación 

Figura 1.12 Histograma de calificaciones de las escuelas obtenido con MINITAB. 

Más de la mitad de los encuestados otorgaron una calificación A o B y sólo un poco más de 
10% otorgó una calificación D o F. Los porcentajes de padres de niños que asisten a escuelas 
públicas fueron un poco más favorables para las escuelas: 24, 40, 24, 6, 4 y 2 por ciento. ■ 

Datos multivariantes 

Los datos multivariantes en general son más difíciles de describir en forma visual. Varios 
métodos para hacerlo aparecen más adelante en el libro, notablemente en gráficas de pun¬ 
tos de datos numéricos bivariantes. 


EJERCICIOS Sección 1.2 (10-32) 


10. Considere los datos de resistencia de las vigas del ejemplo 1.2. 

a. Construya una gráfica de tallos y hojas de los datos. 
¿Cuál parece ser el valor de resistencia representativo? 
¿Parecen estar las observaciones altamente concentradas 
en torno al valor representativo o algo dispersas? 

b. ¿Parece ser la gráfica razonablemente simétrica en torno 
a un valor representativo o describiría su forma de otra 
manera? 

c. ¿Parece haber algunos valores de resistencia extremos? 

d. ¿Qué proporción de las observaciones de resistencia en 
esta muestra exceden de 10 MPa? 

11. Cada calificación en el siguiente lote de calificaciones de 
exámenes se encuentra en los 60, 70, 80 o 90. Una gráfica 
de tallos y hojas con sólo los cuatro tallos 6, 7, 8 y 9 no des¬ 
cribiría detalladamente la distribución de calificaciones. En 
tales situaciones, es deseable utilizar tallos repetidos. En es¬ 
te caso se repetiría el tallo 6 dos veces, utilizando 6L para 
las calificaciones en los 60 bajos (hojas 0, 1, 2, 3 y 4) y 6H 
para las calificaciones en los 60 altos (hojas 5, 6, 7, 8 y 9). 
Asimismo, los demás tallos pueden ser repetidos dos veces 
para obtener una gráfica de ocho filas. Construya la gráfi¬ 
ca para las calificaciones dadas. ¿Qué característica de los 
datos es resaltada por esta gráfica? 


74 

89 

80 

93 

64 

67 

72 

70 

66 

85 

89 

81 

81 

71 

74 

82 

85 

63 

72 

81 

81 

95 

84 

81 

80 

70 

69 

88 

66 

60 

83 

85 

98 

84 

68 

90 

82 

69 

72 

87 


12. Los valores de densidad relativa anexos de varios tipos de 
madera utilizados en la constmcción aparecieron en el artícu¬ 
lo ("Bolted Connection Design Valúes Based on European 
Yield Model”, J. of Structural Engr., 1993: 2169-2186): 


0.31 

0.35 

0.36 

0.36 

0.37 

0.38 

0.40 

0.40 

0.40 

0.41 

0.41 

0.42 

0.42 

0.42 

0.42 

0.42 

0.43 

0.44 

0.45 

0.46 

0.46 

0.47 

0.48 

0.48 

0.48 

0.51 

0.54 

0.54 

0.55 

0.58 

0.62 

0.66 

0.66 

0.67 

0.68 

0.75 


Construya una gráfica de tallos y hojas con tallos repetidos 
(véase el ejercicio previo) y comente sobre cualquier carac¬ 
terística interesante de la gráfica. 

13. Las propiedades mecánicas permisibles para el diseño es¬ 
tructural de vehículos aeroespaciales metálicos requieren un 
método aprobado para analizar estadísticamente datos de 
pmeba empíricos. El artículo (“Establishing Mechanical Pro- 
perty Allowables for Metals”, J. of Testing and Evaluation, 
1998: 293-299) utilizó los datos anexos sobre resistencia a la 
tensión última (lb/pulg 2 ) como base para abordar las dificul¬ 
tades que se presentan en el desarrollo de dicho método. 
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134.7 

134.7 
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137.9 

137.9 

138.2 

138.2 

138.3 

138.3 

138.4 

138.4 

138.4 

138.5 

138.5 

138.6 

138.7 

138.7 

139.0 

139.1 

139.5 

139.6 

139.8 

139.8 

140.0 

140.0 

140.7 

140.7 

140.9 

140.9 

141.2 

141.4 

141.5 

141.6 

142.9 

143.4 

143.5 

143.6 

143.8 

143.8 

143.9 

144.1 

144.5 

144.5 

147.7 

147.7 


a. Construya una gráfica de tallos y hojas de los datos eli¬ 
minando (truncando) los dígitos de décimos y luego re¬ 
pitiendo cada valor de tallo cinco veces (una vez para las 
hojas 1 y 2, una segunda vez para las hojas 3 y 4, etc.). 
¿Por qué es relativamente fácil identificar un valor de re¬ 
sistencia representativo? 

b. Construya un histograma utilizando clases de ancho 
igual con la primera clase que tiene un límite inferior de 
122 y un límite superior de 124. Enseguida comente so¬ 
bre cualquier característica interesante del histograma. 

14. El conjunto de datos adjunto se compone de observaciones 
del flujo de una regadera (1/min) para una muestra de n = 
129 casas en Perth, Australia (“An Application of Bayes 
Methodology to the Analysis of Diary Records in a Water 
Use Study”, J. Amer. Stat. Assoc., 1987: 705-711): 


4.6 

12.3 

7.1 

7.0 

4.0 

9.2 

6.7 

6.9 

11.5 

5.1 

11.2 

10.5 

14.3 

8.0 

OO 

bo 

6.4 

5.1 

5.6 

9.6 

7.5 

7.5 

6.2 

5.8 

2.3 

3.4 

10.4 

9.8 

6.6 

3.7 

6.4 

8.3 

6.5 

7.6 

9.3 

9.2 

7.3 

5.0 

6.3 

13.8 

6.2 

5.4 

4.8 

7.5 

6.0 

6.9 

10.8 

7.5 

6.6 

5.0 

3.3 

7.6 

3.9 

11.9 

2.2 

15.0 

7.2 

6.1 

15.3 

18.9 

7.2 

5.4 

5.5 

4.3 

9.0 

12.7 

11.3 

7.4 

5.0 

3.5 

8.2 

8.4 

7.3 

10.3 

11.9 

6.0 

5.6 

9.5 

9.3 

10.4 

9.7 

5.1 

6.7 

10.2 

6.2 

8.4 

7.0 

4.8 

5.6 

10.5 

14.6 

10.8 

15.5 

7.5 

6.4 

3.4 

5.5 

6.6 

5.9 

15.0 

9.6 

7.8 

7.0 

6.9 

4.1 

3.6 

11.9 

3.7 

5.7 

6.8 

11.3 

9.3 

9.6 

10.4 

9.3 

6.9 

9.8 

9.1 

10.6 

4.5 

6.2 

8.3 

3.2 

4.9 

5.0 

6.0 

8.2 

6.3 

3.8 

6.0 



a. Construya una gráfica de tallos y hojas de los datos. 

b. ¿Cuál es una velocidad de flujo o gasto típico o repre¬ 
sentativo? 

c. ¿Parece estar la gráfica altamente concentrada o dis¬ 
persa? 

d. ¿Es la distribución de valores razonablemente simétrica? 
Si no, ¿cómo describiría el alejamiento de la simetría? 

e. ¿Describiría cualquier observación como alejada del 
resto de los datos (un valor extremo)? 

15. Un artículo de Consumer Reports sobre crema de cacahua¬ 
te (septiembre de 1990) reportó las siguientes calificaciones 
para varias marcas: 


Creamy 

56 

44 

62 

36 

39 

53 

50 

65 

45 


56 

68 

41 

30 

40 

50 

56 

30 

22 

Crunchy 

62 

53 

75 

42 

47 

40 

34 

62 

52 


50 

34 

42 

36 

75 

80 

47 

56 

62 
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Construya una gráfica de tallos y hojas comparativa y pon¬ 
ga una lista de tallos a la mitad de la página y luego coloque 
las hojas “creamy” a la derecha y las “crunchy” a la izquier¬ 
da. Describa las similitudes y diferencias de los dos tipos. 

16. El artículo citado en el ejemplo 1.2 también dio las obser¬ 
vaciones de resistencia adjuntas para los cilindros: 

6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3 

7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2 

a. Construya una gráfica de tallos y hojas comparativa (véa¬ 
se el ejercicio previo) de los datos de la viga y el cilindro 
y luego responda las preguntas en las partes b)-d) del 
ejercicio 10 para las observaciones de los cilindros. 

b. ¿En qué formas son similares los dos lados de la gráfi¬ 
ca? ¿Existen algunas diferencias obvias entre las obser¬ 
vaciones de la viga y las observaciones del cilindro? 

c. Construya una gráfica de puntos de los datos del cilindro. 

17. Transductores de temperatura de cierto tipo se envían en lotes 
de 50. Se seleccionó una muestra de 60 lotes y se determinó 
el número de transductores en cada lote que no cumplen 
con las especificaciones de diseño y se obtuvieron los datos 
siguientes: 

21240132053313247023 

04213113412322845131 

50232106421603336123 

a. Determine las frecuencias y las frecuencias relativas de 
los valores observados de ,r = número de transductores 
en un lote que no cumple con las especificaciones. 

b. ¿Qué proporción de lotes muestreados tienen a lo sumo 
cinco transductores que no cumplen con las especificacio¬ 
nes? ¿Qué proporción tiene menos de cinco? ¿Qué propor¬ 
ción tienen por lo menos cinco unidades que no cumplen 
con las especificaciones? 

c. Trace un histograma de los datos que utilizan la frecuencia 
relativa en la escala vertical y comente sus características. 

18. En un estudio de productividad de autores (“Lotka’s Test”, 
Collection Mgmt., 1982: 111-118), se clasificó a un gran nú¬ 
mero de autores de artículos de acuerdo con el número de ar¬ 
tículos que publicaron durante cierto periodo. Los resultados 
se presentaron en la distribución de frecuencia adjunta: 


Número de 

artículos 

1 

2 

3 

4 

5 

6 

7 

8 


Frecuencia 

784 

204 

127 

50 

33 

28 

19 

19 


Número de 

artículos 

9 

10 

11 

12 

13 

14 

15 

16 

17 

Frecuencia 

6 

7 

6 

7 

4 

4 

5 

3 

3 


a. Construya un histograma correspondiente a esta distri¬ 
bución de frecuencia. ¿Cuál es la característica más in¬ 
teresante de la forma de la distribución? 

b. ¿Qué proporción de estos autores publicó por lo menos 
cinco artículos? ¿Por lo menos diez artículos? ¿Más de 
diez artículos? 

c. Suponga que los cinco 15, los tres 6 y los tres 17 se 
agruparon en una sola categoría mostrada como “S 15”. 
¿Podría trazar un histograma? Explique. 
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d. Suponga que los valores 15, 16y 17 se enlistan por se¬ 
parado y se combinan en la categoría 15-17 con frecuen¬ 
cia 11. ¿Sería capaz de trazar un histograma? Explique. 

19. Se determinó el número de partículas contaminadas en una 
oblea de silicio antes de cierto proceso de enjuague por ca¬ 
da oblea en una muestra de tamaño 100 y se obtuvieron las 
siguientes frecuencias: 


Número de 

partículas 

0 

1 

2 

3 

4 

5 

6 

7 

Frecuencia 

1 

2 

3 

12 

11 

15 

18 

10 

Número de 

partículas 

8 

9 

10 

11 

12 

13 

14 


Frecuencia 

12 

4 

5 

3 

1 

2 

1 



a. ¿Qué proporción de las obleas muestreadas tuvieron por 
lo menos una partícula? ¿Por lo menos cinco partículas? 

b. ¿Qué proporción de las obleas muestreadas tuvieron en¬ 
tre cinco y diez partículas, inclusive? ¿Estrictamente entre 
cinco y diez partículas? 

c. Trace un histograma con la frecuencia relativa en el eje 
vertical. ¿Cómo describiría la forma del histograma? 

20. El artículo (“Determination of Most Representative Subdi¬ 
visión”, J. of Energy Engr., 1993: 43-55) dio datos sobre 
varias características de subdivisiones que podrían ser utili¬ 
zados para decidir si se suministra energía eléctrica con lí¬ 
neas elevadas o líneas subterráneas. He aquí los valores de 
la variable x = longitud total de calles dentro de una subdi¬ 
visión: 


1280 

5320 

4390 

2100 

1240 

3060 

4770 

1050 

360 

3330 

3380 

340 

1000 

960 

1320 

530 

3350 

540 

3870 

1250 

2400 

960 

1120 

2120 

450 

2250 

2320 

2400 

3150 

5700 

5220 

500 

1850 

2460 

5850 

2700 

2730 

1670 

100 

5770 

3150 

1890 

510 

240 

396 

1419 

2109 




Histograma del ejercicio 22 


a. Construya una gráfica de hojas y tallos con las milési¬ 
mas como el tallo y las centésimas como las hojas y co¬ 
mente sobre algunas características de la gráfica. 

b. Construya un histograma con los límites de clase, 0, 
1000, 2000, 3000, 4000, 5000 y 6000. ¿Qué proporción 
de subdivisiones tienen una longitud total menor que 
2000? ¿Entre 2000 y 4000? ¿Cómo describiría la forma 
del histograma? 

21. El artículo citado en el ejercicio 20 también da los siguien¬ 
tes valores de las variables y = número de calles cerradas y 
z = número de intersecciones: 

yl0100201 1 121001 1011 
zl861 153004400121404 
yl 10001 1201221 102110 
z 0 3 0 1 1013246601 18335 

y 1 5 0 3 0 1 1 0 0 

z 0 5 2 3 10003 

a. Construya un histograma con los datos y. ¿Qué propor¬ 
ción de estas subdivisiones no tenía calles cerradas? 
¿Por lo menos una calle cerrada? 

b. Construya un histograma con los datos z. ¿Qué propor¬ 
ción de estas subdivisiones tenía cuando mucho cinco 
intersecciones? ¿Menos de cinco intersecciones? 

22. ¿Cómo varía la velocidad de un corredor en el recorrido del 
curso de un maratón (una distancia de 42.195 km)? Consi¬ 
dere determinar tanto el tiempo de recorrido de los prime¬ 
ros 5 km y el tiempo de recorrido entre los 35 y 40 km, y 
luego reste el primer tiempo del segundo. Un valor posi¬ 
tivo de esta diferencia corresponde a un corredor que co¬ 
rre más lento hacia el final de la carrera. El histograma 
adjunto está basado en tiempos de corredores que partici¬ 
paron en varios maratones japoneses (‘‘Factors Affecting 
Runners’ Maratón Performance”, Chance, otoño de 1993: 
24-30). 


Frecuencia 
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¿Cuáles son algunas características interesantes de este 
histograma? ¿Cuál es un valor de diferencia típico? ¿Apro¬ 
ximadamente qué proporción de los competidores corren la 
última distancia más rápido que la primera? 

23. En un estudio de ruptura de la urdimbre durante el tejido de 
telas ( Technometrics , 1982: 63), se sometieron aprueba 100 
muestras de hilo. Se determinó el número de ciclos de es¬ 
fuerzo hasta ruptura para cada muestra de hilo y se obtuvie¬ 
ron los datos siguientes: 


86 

146 

251 

653 

98 

249 

400 

292 

131 

169 

175 

176 

76 

264 

15 

364 

195 

262 

88 

264 

157 

220 

42 

321 

180 

198 

38 

20 

61 

121 

282 

224 

149 

180 

325 

250 

196 

90 

229 

166 

38 

337 

65 

151 

341 

40 

40 

135 

597 

246 

211 

180 

93 

315 

353 

571 

124 

279 

81 

186 

497 

182 

423 

185 

229 

400 

338 

290 

398 

71 

246 

185 

188 

568 

55 

55 

61 

244 

20 

284 

393 

396 

203 

829 

239 

236 

286 

194 

277 

143 

198 

264 

105 

203 

124 

137 

135 

350 

193 

188 


a. Construya un histograma de frecuencia relativa basado 
en los intervalos de clase 0-<100, 100-<200, ... y co¬ 
mente sobre las características del histograma. 

b. Construya un histograma basado en los siguientes inter¬ 
valos de clase: 0-<50, 50-<100, 100-<150, 150-<200, 
200-<300, 300-<400, 400-<500, 500-<600 y 600-<900. 

c. Si las especificaciones de tejido requieren una resistencia 
a la ruptura de por lo menos 100 ciclos, ¿qué proporción 
de los especímenes de hilos en esta muestra sería consi¬ 
derada satisfactoria? 

24. El conjunto de datos adjuntos consiste en observaciones de 
resistencia al esfuerzo cortante (Ib) de soldaduras de puntos 
ultrasónicas aplicadas en un cierto tipo de lámina alelad. 
Construya un histograma de frecuencia relativa basado en 
diez clases de ancho igual con límites 4000, 4200, ... [El 
histograma concordará con el que aparece en (“Comparison 
of Properties of Joints Prepared by Ultrasonic Welding and 
Other Means”, J. of Aircraft, 1983: 552-556).] Comente so¬ 
bre sus características. 


5434 

4948 

4521 

4570 

4990 

5702 

5241 

5112 

5015 

4659 

4806 

4637 

5670 

4381 

4820 

5043 

4886 

4599 

5288 

5299 

4848 

5378 

5260 

5055 

5828 

5218 

4859 

4780 

5027 

5008 

4609 

4772 

5133 

5095 

4618 

4848 

5089 

5518 

5333 

5164 

5342 

5069 

4755 

4925 

5001 

4803 

4951 

5679 

5256 

5207 

5621 

4918 

5138 

4786 

4500 

5461 

5049 

4974 

4592 

4173 

5296 

4965 

5170 

4740 

5173 

4568 

5653 

5078 

4900 

4968 

5248 

5245 

4723 

5275 

5419 

5205 

4452 

5227 

5555 

5388 

5498 

4681 

5076 

4774 

4931 

4493 

5309 

5582 

4308 

4823 

4417 

5364 

5189 

5640 

4986 

5069 

5188 

5764 

5273 

5042 


25. Una transformación de valores de datos por medio de alguna 
función matemática, tal como Vr o \íx a menudo produce 
un conjunto de números que tienen “mejores” propiedades 
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estadísticas que los datos originales. En particular, puede ser 
posible encontrar una función para la cual el histograma de 
valores transformados es más simétrico (o, incluso mejor, 
más parecido a una curva en forma de campana) que los datos 
originales. Por ejemplo, el artículo (“Time Lapse Cinemato- 
graphic Analysis of Beryllium-Lung Fibroblast Interactions”, 
Environ. Research, 1983: 34-43) reportó los resultados de ex¬ 
perimentos diseñados para estudiar el comportamiento de 
ciertas células individuales que habían estado expuestas a be¬ 
rilio. Una importante característica de dichas células indivi¬ 
duales es su tiempo de interdivisión (IDT, por sus siglas en 
inglés). Se determinaron tiempos de interdivisión de un gran 
número de células tanto en condiciones expuestas (tratamien¬ 
to) como no expuestas (control). Los autores del artículo uti¬ 
lizaron una transformación logarítmica, es decir, valor 
transformado = log(valor original). Considere los siguientes 
tiempos de interdivisión representativos. 


IDT 

log 10 (IDT) 

IDT 

logio(IDT) 

IDT 

log 10 (IDT) 

28.1 

1.45 

60.1 

1.78 

21.0 

1.32 

31.2 

1.49 

23.7 

1.37 

22.3 

1.35 

13.7 

1.14 

18.6 

1.27 

15.5 

1.19 

46.0 

1.66 

21.4 

1.33 

36.3 

1.56 

25.8 

1.41 

26.6 

1.42 

19.1 

1.28 

16.8 

1.23 

26.2 

1.42 

38.4 

1.58 

34.8 

1.54 

32.0 

1.51 

72.8 

1.86 

62.3 

1.79 

43.5 

1.64 

48.9 

1.69 

28.0 

1.45 

17.4 

1.24 

21.4 

1.33 

17.9 

1.25 

38.8 

1.59 

20.7 

1.32 

19.5 

1.29 

30.6 

1.49 

57.3 

1.76 

21.1 

1.32 

55.6 

1.75 

40.9 

1.61 

31.9 

1.50 

25.5 

1.41 



28.9 

1.46 

52.1 

1.72 




Use los intervalos de clase 10-<20, 20-<30, . . . para cons¬ 
truir un histograma de los datos originales. Use los intervalos 
1.1—<1.2, 1.2—<1.3, . . . para hacer lo mismo con los datos 
transformados. ¿Cuál es el efecto de la transformación? 

26. En la actualidad se está utilizando la difracción retrodisper- 
sada de electrones en el estudio de fenómenos de fractura. 
La siguiente información sobre ángulo de desorientación 
(grados) se extrajo del artículo (“Observations on the Face- 
ted Initiation Site in the Dwell-Fatigue Tested Ti-6242 
Alloy: Crystallographic Orientation and Size Effects”, Me- 
tallurgical and Materials Trans., 2006: 1507-1518). 


Clase : 

0-<5 

5-C10 

10—<15 

15-<20 

Frec. reír. 

0.177 

0.166 

0.175 

0.136 

Clase : 

20-<30 

30-<40 

40-<60 

60-<90 

Frec. reír. 

0.194 

0.078 

0.044 

0.030 


a. ¿Es verdad que más de 50% de los ángulos muestreados 
son más pequeños que 15°, como se afirma en el artículo? 

b. ¿Qué proporción de los ángulos muestreados son por lo 
menos de 30°? 

c. ¿Aproximadamente qué proporción de los ángulos son 
de entre 10° y 25°? 

d. Construya un histograma y comente sobre cualquier ca¬ 
racterística interesante. 
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27. El artículo (“Study on the Life Distribution of Microdrills”, 
J. of Engr. Manufacture , 2002: 301-305) reportó las si¬ 
guientes observaciones, listadas en orden creciente sobre la 
duración de brocas (número de agujeros que una broca fre¬ 
sa antes de que se rompa) cuando se fresaron agujeros en 
una cierta aleación de latón. 


11 

14 

20 

23 

31 

36 

39 

44 

47 

50 

59 

61 

65 

67 

68 

71 

74 

76 

78 

79 

81 

84 

85 

89 

91 

93 

96 

99 

101 

104 

105 

105 

112 

118 

123 

136 

139 

141 

148 

158 

161 

168 

184 

206 

248 

263 

289 

322 

388 

513 


a. ¿Por qué una distribución de frecuencia no puede estar 
basada en los intervalos de clase 0-50, 50-100, 100-150 
y así sucesivamente? 

b. Construya una distribución de frecuencia e histograma 
de los datos con los límites de clase 0, 50, 100, ... y lue¬ 
go comente sobre las características interesantes. 

c. Construya una distribución de frecuencia e histograma 
de los logaritmos naturales de las observaciones de du¬ 
ración y comente sobre características interesantes. 

d. ¿Qué proporción de las observaciones de duración en 
esta muestra son menores que 100? ¿Qué proporción de 
las observaciones son de por lo menos 200? 

28. Las mediciones humanas constituyen una rica área de apli¬ 

cación de métodos estadísticos. El artículo (“A Longitudinal 
Study of the Development of Elementary School Children’s 
Prívate Speech”, Merrill-Palmer Q., 1990: 443-463) repor¬ 
tó sobre un estudio de niños que hablan solos (conversación 
a solas). Se pensaba que la conservación a solas tenía que 
ver con el IQ, porque se supone que éste mide la madurez 
mental y se sabía que la conservación a solas disminuye 
conforme los estudiantes avanzan a través de los años de la 
escuela primaria. El estudio incluyó 33 estudiantes cuyas 
calificaciones de IQ de primer año se dan a continuación: 

82 96 99 102 103 103 106 107 108 108 108 108 

109 110 110 111 113 113 113 113 115 115 118 118 

119 121 122 122 127 132 136 140 146 

Describa los datos y comente sobre cualquier característica 
importante. 

29. Considere los siguientes datos sobre el tipo de problemas de 
salud (J = hinchazón de las articulaciones, F = fatiga, B = 
dolor de espalda, M = debilidad muscular, C = tos, N = 
nariz suelta/irritación, O = otro) que aquejan a los planta¬ 
dores de árboles. Obtenga las frecuencias y las frecuencias 
relativas de las diversas categorías y trace un histograma. 
(Los datos son consistentes con los porcentajes dados en el 
artículo (“Physiological Effects of Work Stress and Pestici- 


de Exposure in Tree Planting de British Columbia Silvicul- 
ture Workers”, Ergonomics, 1993: 951-961.) 

OONJCFBBFOJOOM 
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30. Un diagrama de Pareto es una variación de un histograma 
de datos categóricos producidos por un estudio de control de 
calidad. Cada categoría representa un tipo diferente de no 
conformidad del producto o problema de producción. Las ca¬ 
tegorías se ordenaron de modo que la categoría con la fre¬ 
cuencia más grande aparezca a la extrema izquierda, luego la 
categoría con la segunda frecuencia más grande, y así sucesi¬ 
vamente. Suponga que se obtiene la siguiente información 
sobre no conformidades en paquetes de circuito: componen¬ 
tes averiados, 126; componentes incorrectos, 210; soldadura 
insuficiente, 67; soldadura excesiva, 54; componente faltan- 
te, 131. Construya un diagrama de Pareto. 

31. La frecuencia acumulativa y la frecuencia relativa acumula¬ 
tiva de un intervalo de clase particular son la suma de frecuen¬ 
cias y frecuencias relativas, respectivamente, del intervalo y 
todos los intervalos que quedan debajo de él. Si, por ejem¬ 
plo, existen cuatro intervalos con frecuencias 9, 16, 13 y 12, 
entonces las frecuencias acumulativas son 9, 25, 38 y 50 y 
las frecuencias relativas acumulativas son 0.18, 0.50, 0.76 
y LOO Calcule las frecuencias acumulativas y las frecuen¬ 
cias relativas de los datos del ejercicio 24. 

32. La carga de incendio (MJ/m 2 ) es la energía calorífica que po¬ 
dría ser liberada por metro cuadrado de área de piso por la 
combustión del contenido y la estructura misma. El artículo 
(“Fire Loads in Office Buildings”, J. of Structural Engr., 
1997: 365-368) dio los siguientes porcentajes acumulativos 
(tomados de una gráfica) de cargas de fuego en una muestra 
de 388 cuartos: 


Valor 

0 

150 

300 

450 

600 

% acumulativo 

0 

19.3 

37.6 

62.7 

77.5 

Valor 

750 

900 

1050 

1200 

1350 

% acumulativo 

87.2 

93.8 

95.7 

98.6 

99.1 

Valor 

1500 

1650 

1800 

1950 


% acumulativo 

99.5 

99.6 

99.8 

100.0 



a. Construya un histograma de frecuencia relativa y co¬ 
mente sobre características interesantes. 

b. ¿Qué proporción de cargas de fuego es menor que 600? 
¿Por lo menos de 1200? 

c. ¿Qué proporción de las cargas está entre 600 y 1200? 


1.3 Medidas de localización 


Los resúmenes visuales de datos son herramientas excelentes para obtener impresiones y 
percepciones preliminares. Un análisis de datos más formal a menudo requiere el cálculo e 
interpretación de medidas resumidas numéricas. Es decir, de los datos se trata de extraer va¬ 
rios números resumidos, números que podrían servir para caracterizar el conjunto de datos 
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y comunicar algunas de sus características prominentes. El interés principal se concentrará 
en los datos numéricos; al final de la sección aparecen algunos comentarios con respecto a 
datos categóricos. 

Supóngase, entonces, que el conjunto de datos es de la forma x lt x 2 , ■ ■ ., x n , donde ca¬ 
da x¡ es un número. ¿Qué características del conjunto de números son de mayor interés y 
merecen énfasis? Una importante característica de un conjunto de números es su localiza¬ 
ción y en particular su centro. Esta sección presenta métodos para describir la localización 
de un conjunto de datos; en la sección 1.4 se regresará a los métodos para medir la variabi¬ 
lidad en un conjunto de números. 


La media 


Para un conjunto dado de números x¡, x 2 ,..., x n , la medida más conocida y útil del centro 
es la media o promedio aritmético del conjunto. Como casi siempre se pensará que los nú¬ 
meros x¡ constituyen una muestra, a menudo se hará referencia al promedio aritmético co¬ 
mo la media muestral y se la denotará por x. 


DEFINICIÓN La media muestral x de las observaciones x v x 2 , . . . , x n está dada por 

n 


x l + x 2 + 


+ 


1=1 

n 


El numerador de x se escribe más informalmente como Xx ¡, donde la suma incluye 
todas las observaciones muéstrales. 


Para reportar x, se recomienda utilizar una precisión decimal de un dígito más que la preci¬ 
sión de los números x¡. Por consiguiente las observaciones son distancias de detención con 
x 1 = 125, x 2 = 131 y así sucesivamente, se podría tener x = 127.3 pies. 


Ejemplo 1.12 El agrietamiento de hierro y acero provocado por corrosión producida por esfuerzo cáusti¬ 
co ha sido estudiado debido a las fallas que se presentan alrededor de los remaches en cal¬ 
deras de acero y fallas de rotores de turbinas de vapor. Considérense las observaciones 
adjuntas de x = longitud de agrietamiento (/a,m) derivadas de pruebas de corrosión con es¬ 
fuerzo constante en probetas de barras pulidas sometidas a tensión durante un periodo fijo. 
(Los datos concuerdan con un histograma y cantidades resumidas tomadas del artículo “On 
the Role of Phosphorus in the Caustic Stress Corrosión Cracking of Low Alloy Steels”, Co¬ 
rrosión Science, 1989: 53-68.) 


Xj = 16.1 x 2 = 9.6 x 3 = 24.9 x 4 = 20.4 x 5 = 12.7 x 6 = 21.2 x 7 = 30.2 

x g = 25.8 x 9 = 18.5 x 10 = 10.3 x n = 25.3 x 12 = 14.0 x 13 = 27.1 x 14 = 45.0 

x 15 = 23.3 x 16 = 24.2 x 17 = 14.6 x lg = 8.9 x 19 = 32.4 x 20 = 11.8 x 21 = 28.5 


La figura 1.13 muestra una gráfica de tallo y hojas de los datos; una longitud de agrietamien- 
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Con 5X = 444.8, la media muestral es 


x 


444.8 

21 


21.18 


un valor consistente conforme a la información dada por la gráfica de tallo y hojas. ■ 


Una interpretación física de x demuestra cómo mide la ubicación (centro) de una 
muestra. Se traza y gradúa un eje de medición horizontal y luego se representa cada obser¬ 
vación muestral por una pesa de 1 Ib colocada en el punto correspondiente sobre el eje. El 
único punto en el cual se puede colocar un punto de apoyo para equilibrar el sistema de pe¬ 
sas es el punto correspondiente al valor de x (véase la figura 1.14). 


x = 21,18 

I 

—••!»»» M —•-• [«-• ■ ■ ■««—•—• I»-•-1-1-4- 

10 20^ 30 40 

Figura 1.14 La media como punto de equilibrio de un sistema de pesas. 

Así como x representa el valor promedio de las observaciones incluidas en una mues¬ 
tra, se puede calcular el promedio de todos los valores incluidos en la población. Este pro¬ 
medio se llama media de la población y está denotada por la letra griega p. Cuando existen 
N valores en la población (una población finita), entonces p = (suma de los N valores de 
población)/^. En los capítulos 3 y 4, se dará una definición más general de p que se aplica 
tanto a poblaciones finitas y (conceptualmente) infinitas. Así como x es una medida intere¬ 
sante e importante de la ubicación de la muestra, p es una interesante e importante caracte¬ 
rística (con frecuencia la más importante) de una población. En los capítulos de inferencia 
estadística, se presentarán métodos basados en la media muestral para sacar conclusiones 
con respecto a una media de población. Por ejemplo, se podría utilizar la media muestral 
x = 21.18 calculada en el ejemplo 1.12 como una estimación puntual (un solo número que 
es la “mejor” conjetura) de p = la longitud de agrietamiento promedio verdadera de todas las 
probetas tratadas como se describe. 

La media sufre de una deficiencia que la hace ser una medida inapropiada del centro 
en algunas circunstancias: su valor puede ser afectado en gran medida por la presencia de 
incluso un solo valor extremo (una observación inusualmente grande o pequeña). En el 
ejemplo 1.12, el valor x í4 = 45.0 es obviamente un valor extremo. Sin esta observación, 
x = 399.8/20 = 19.99; el valor extremo incrementa la media en más de 1 pm. Si la obser¬ 
vación de 45.0 (i,m fuera reemplazada por el valor catastrófico de 295.0 pm, un valor real¬ 
mente extremo, entonces x = 694.8/21 = 33.09, ¡el cual es más grande que todos excepto 
una de las observaciones! 

Una muestra de ingresos a menudo produce algunos valores apartados (unos cuantos 
afortunados que gana cantidades astronómicas) y el uso del ingreso promedio como medi¬ 
da de ubicación con frecuencia será engañoso. Tales ejemplos sugieren que se busca una 
medida que sea menos sensible a los valores apartados que x y momentáneamente se pro¬ 
pondrá una. Sin embargo, aunque x sí tiene este defecto potencial, sigue siendo la medida 
más ampliamente utilizada, en gran medida porque existen muchas poblaciones para las 
cuales un valor extremo en la muestra sería altamente improbable. Cuando se muestrea una 
población como esa (una población normal o en forma de campana es el ejemplo más im¬ 
portante), la media muestral tenderá a ser estable y bastante representativa de la muestra. 

La mediana 

La palabra mediana es sinónimo de “medio” y la mediana muestral es en realidad el valor 
medio una vez que se ordenan las observaciones de la más pequeña a la más grande. Cuando 
las observaciones están denotadas por*!,. . ., x n , se utilizará el símbolo x para representar la 
mediana muestral. 
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DEFINICIÓN 


Ejemplo 1.13 


e 
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La mediana muestral se obtiene ordenando primero las n observaciones de la más 
pequeña a la más grande (con cualesquiera valores repetidos incluidos de modo que 
cada observación muestral aparezca en la lista ordenada). Entonces, 


El valor 
medio único 
si n es 
impar 

El promedio 
de los dos 
valores 
medios si n 
es par 


n + 1 \n-ésimo 


valor ordenado 


= promedio de 




valores ordenados 


El riesgo de desarrollar deficiencia de hierro es especialmente alto durante el embarazo. El 
problema con la detección de tal deficiencia es que algunos métodos para determinar el es¬ 
tado del hierro pueden ser afectados por el estado de gravidez mismo. Considérense las si¬ 
guientes observaciones ordenadas de concentración de receptores de transferrina de una 
muestra de mujeres con evidencia de laboratorio de anemia por deficiencia de hierro eviden¬ 
te (“Serum Transferrin Receptor for the Detection of Iron Deficiency in Pregnancy”, Amer. 
J. of Clinical Nutrition, 1991: 1077-1081): 

7.6 8.3 9.3 9.4 9.4 9.7 10.4 11.5 11.9 15.2 16.2 20.4 

Como n = 12 es par, el n/2 = los valores sexto y séptimo ordenados deben ser promedia¬ 
dos: 


x 


9.7 + 10.4 
2 


10.05 


Note que si la observación más grande, 20.4, no hubiera aparecido en la muestra, la media¬ 
na muestral resultante de las «=11 observaciones habría sido el valor medio 9.7 [el (n + l)/2 
= sexto valor ordenado]. La media muestral es x = Y,x¡/n = 139.3/12 = 11.61, la cual es 
un tanto más grande que la mediana debido a los valores apartados 15.2, 16.2 y 20.4. ■ 


Los datos del ejemplo 1.13 ilustran una importante propiedad de x en contraste con x. 
La mediana muestral es muy insensible a los valores apartados. Si, por ejemplo, las dos x¡ 
más grandes se incrementan desde 16.2 y 20.4 hasta 26.2 y 30.4, respectivamente, x no se 
vería afectada. Por lo tanto, en el tratamiento de valores apartados, iyxno son extremos 
opuestos de un espectro. 

Debido a que los valores grandes presentes en la muestra del ejemplo 1.13 afectan 
a x más que x,x<x con esos datos. Aunque tanto x como x ubican el centro de un con¬ 
junto de datos, en general no serán iguales porque se enfocan en aspectos diferentes de la 
muestra. 

Análogo a x como valor medio de la muestra es un valor medio de la población, la 
mediana poblacional, denotada por f. Como con x y /x, se puede pensar en utilizar la me¬ 
diana muestral x para hacer una inferencia sobre ¡±. En el ejemplo 1.13, se podría utilizar 
x = 10.05 como estimación de la concentración de la mediana en toda la población de 
la cual se tomó la muestra. A menudo se utiliza una mediana para describir ingresos o sala¬ 
rios (debido a que no es influida en gran medida por unos pocos salarios grandes). Si el sa¬ 
lario mediano de una muestra de ingenieros fuera x = 66416 dólares se podría utilizar 
como base para concluir que el salario mediano de todos los ingenieros es de más de 60 000 
dólares. 
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fj, fL 

a) Asimétrico negativo 



/x = /r 
b) Simétrico 



P /x 

c) Asimétrico positivo 


Figura 1.15 Tres formas diferentes de una distribución de población. 


La media ¡j, y la mediana jl poblacionales en general no serán idénticas. Si la distri¬ 
bución de la población es positiva o negativamente asimétrica, como se ilustra en la figura 
1.15, entonces /jl # jl. Cuando éste es el caso, al hacer inferencias primero se debe decidir 
cuál de las dos características de la población es de mayor interés y luego proceder como 
corresponda. 


Otras medidas de localización: 
cuartiles, percentiles y medias recortadas 

La mediana (poblacional o muestral) divide el conjunto de datos en dos partes iguales. Pa¬ 
ra obtener medidas de ubicación más finas, se podrían dividir los datos en más de dos par¬ 
tes. Tentativamente, los cuartiles dividen el conjunto de datos en cuatro partes iguales y las 
observaciones arriba del tercer cuartil constituyen el cuarto superior del conjunto de datos, 
el segundo cuartil es idéntico a la mediana y el primer cuartil separa el cuarto inferior de los 
tres cuartos superiores. Asimismo, un conjunto de datos (muestra o población) puede ser in¬ 
cluso más finamente dividido por medio de percentiles, el 99° percentil separa el 1% más 
alto del 99% más bajo, y así sucesivamente. A menos que el número de observaciones sea 
un múltiplo de 100, se debe tener cuidado al obtener percentiles. En el capítulo 4 se utiliza¬ 
rán percentiles con conexión con ciertos modelos de poblaciones infinitas y por tanto su dis¬ 
cusión se pospone hasta ese punto. 

La media es bastante sensible a un solo valor extremo, mientras que la mediana es in¬ 
sensible a muchos valores apartados. Como el comportamiento extremo de uno u otro tipo 
podría ser indeseable, se consideran brevemente medidas alternativas que no son ni sensi¬ 
bles como x ni tan insensibles como x. Para motivar estas alternativas, obsérvese que iyx 
se encuentran en extremos opuestos de la misma “familia” de medidas. La media es el pro¬ 
medio de todos los datos, mientras que la mediana resulta de eliminar todos excepto uno o 
dos valores medios y luego promediar. Parafraseando, la media implica recortar 0% de cada 
extremo de la muestra, mientras que en el caso de la mediana se recorta la cantidad máxima 
posible de cada extremo. Una muestra recortada es un término medio entre x y x. Una me¬ 
dia 10% recortada, por ejemplo, se calcularía eliminando el 10% más pequeño y el 10% 
más grande de la muestra y luego promediando lo que queda. 

Ejemplo 1.14 La producción de Bidri es una artesanía tradicional de India. Las artesanías Bidri (tazones, 
recipientes, etc.) se funden con una aleación que contiene principalmente zinc y algo de co¬ 
bre. Considere las siguientes observaciones sobre contenido de cobre (%) de una muestra de 
artefactos Bidri tomada del Museo Victoria y Albert en Londres (“Enigmas of Bidri”, Sur- 
face Engr., 2005: 333-339), enlistadas en orden creciente. 

2.0 2.4 2.5 2.6 2.6 2.7 2.7 2.8 3.0 3.1 3.2 3.3 3.3 

3.4 3.4 3.6 3.6 3.6 3.6 3.7 4.4 4.6 4.7 4.8 5.3 10.1 

La figura 1.16 es una gráfica de puntos de los datos. Una característica prominente es el valor 
extremo único en el extremo superior; la distribución está más dispersa en la región de valores 
grandes que en el caso de valores pequeños. La media muestral y la mediana son 3.65 y 3.35, 
respectivamente. Se obtiene una media recortada ( x r ) con un porcentaje de recorte de 100(2/26) 
= 7.7% al eliminar las dos observaciones más pequeñas y las dos más grandes; esto da 
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Figura 1.16 Gráfica de puntos de contenidos de cobre del ejemplo 1.14. 

x ril 7 ) = 3.42. El recorte en este caso elimina el valor extremo más grande y por tanto aproxi¬ 
ma la media recortada hacia la mediana. ■ 

Una media recortada con un porcentaje de recorte moderado, algo entre 5 y 25%, pro¬ 
ducirá una medida del centro que no es ni tan sensible a los valores apartados como la me¬ 
dia ni tan insensible como la mediana. Si el porcentaje de recorte deseado es 1 00a % y na no 
es un entero, la media recortada debe ser calculada por interpolación. Por ejemplo, considé¬ 
rese a = 0.10 para un porcentaje de recorte de 10% y n = 26 como en el ejemplo 1.14. En¬ 
tonces x r( j 0) sería el promedio ponderado apropiado de la media 7.7% recortada calculada allí 
y la media 11.5% recortada que resulta de recortar tres observaciones de cada extremo. 

Datos categóricos y proporciones muéstrales 

Cuando los datos son categóricos, una distribución de frecuencia o una distribución de fre¬ 
cuencia relativa proporciona un resumen tabular efectivo de los datos. Las cantidades resumi¬ 
das numéricas naturales en esta situación son las frecuencias individuales y las frecuencias 
relativas. Por ejemplo, si se realiza una encuesta de personas que poseen cámaras digitales 
para estudiar la preferencia de marcas y cada persona en la muestra identifica la marca de 
cámara que él o ella posee, con lo cual se podría contar el número que poseen Cannon, Sony, 
Kodak, y así sucesivamente. Considérese muestrear una población dividida en dos partes, 
una que consiste en sólo dos categorías (tal como votó o no votó en la última elección, si 
posee o no una cámara digital, etc.). Si x denota el número en la muestra que cae en la 
categoría 1, entonces el número en el categoría 2 es n — x. La frecuencia relativa o propor¬ 
ción muestral en la categoría 1 es x/n y la proporción muestral en la categoría 2 es 1 — xln. 
Que 1 denote una respuesta que cae en la categoría 1 y que 0 denote una respuesta que cae 
en la categoría 2. Un tamaño de muestra de n = 10 podría dar entonces las respuestas 1,1, 
0, 1, 1, 1, 0, 0, 1, 1. La media muestral de esta muestra numérica es (como el número de 
unos = x = 7) 

*i + ■■■ + ■*„ 1 + 1+ 0 + -- -+1 + 1 7 x 

- ñ -=-Jq- = Jq = n = proporción muestral 

Más generalmente, enfóquese la atención en una categoría particular y codifíquense 
los resultados de modo que se anote un 1 para una observación comprendida en la catego¬ 
ría y un 0 para una observación no comprendida en la categoría. Entonces la proporción 
muestral de observaciones comprendida en la categoría es la media muestral de la secuen¬ 
cia de los 1 y los 0. Por consiguiente se puede utilizar una media muestral para resumir los 
resultados de una muestra categórica. Estos comentarios también se aplican a situaciones en 
las cuales las categorías se definen agrupando valores en una muestra o población numéri¬ 
ca (p. ej., podría existir interés en saber si las personas han tenido su automóvil actual du¬ 
rante por lo menos 5 años, en lugar de estudiar la duración exacta de la tenencia). 

Análogo a la proporción muestral x/n de personas u objetos que caen en una catego¬ 
ría particular, que p represente la proporción de aquellos presentes en toda la población que 
cae en la categoría. Como con xln , p es una cantidad entre 0 y 1 y mientras que xln es 
una característica de muestra, p es una característica de la población. La relación entre las 
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dos es igual a la relación entre x y p y entre iy ¡jl. En particular, subsecuentemente se utili¬ 
zará x/n para hacer inferencias sobre p. Si, por ejemplo, una muestra de 100 propietarios de 
automóviles reveló que 22 tenían su automóvil desde por lo menos 5 años atrás, en tal caso se 
podría utilizar 22/100 = 0.22 como estimación puntual de la proporción de todos los propie¬ 
tarios que tenían su automóvil desde por lo menos 5 años atrás. Se estudiarán las propiedades 
de x/n como una estimación de p para ver cómo se puede utilizar x/n para responder otras pre¬ 
guntas inferenciales. Con k categorías (k > 2), se pueden utilizar las k proporciones muéstra¬ 
les para responder preguntas sobre las proporciones de población p ít . . ., p k . 


EJERCICIOS Sección 1.3 (33-43) 


33. El artículo ("The Pedaling Technique of Elite Endurance 
Cyclists”, Inst. J. of Sport Biomechanics, 1991: 29-53) re¬ 
portó los datos adjuntos sobre potencia de una sola pierna 
sometida a una alta carga de trabajo. 

244 191 160 187 180 176 174 

205 211 183 211 180 194 200 

a. Calcule e interprete la media y la mediana muestral. 

b. Suponga que la primera observación hubiera sido 204 en 
lugar de 244. ¿Cómo cambiarían la media y la mediana? 

c. Calcule una media recortada eliminando las observacio¬ 
nes muéstrales más pequeñas y más grandes. ¿Cuál es el 
porcentaje de recorte correspondiente? 

d. El artículo también reportó valores de potencia de una 
sola pierna con carga de trabajo baja. La media muestral 
de n = 13 observaciones fue x = 119.8 (en realidad 
119.7692) y la 14a. observación, algo así como un valor ex¬ 
tremo, fue 159. ¿Cuál es el valor de x de toda la muestra? 

34. La exposición a productos microbianos, especialmente en- 
dotoxina, puede tener un impacto en la vulnerabilidad a 
enfermedades alérgicas. El artículo (“Dust Sampling Methods 
for Endotoxin-An Essential, But Underestimated Issue”, 
Indoor Air, 2006: 20-27) consideró temas asociados con la 
determinación de concentración de endotoxina. Los siguien¬ 
tes datos sobre concentración (EU/mg) en polvo asentado 
de una muestra de hogares urbanos y otra de casas campes¬ 
tres fueron amablemente suministrados por los autores del 
artículo citado. 

U: 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0 
C: 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0 
9.2 3.0 2.0 0.3 

a. Determine la media muestral de cada muestra. ¿Cómo se 
comparan? 

b. Determine la mediana muestral de cada muestra. ¿Cómo 
se comparan? ¿Por qué es la mediana de la muestra ur¬ 
bana tan diferente de la media de dicha muestra? 

c. Calcule la media recortada de cada muestra eliminando 
la observación más pequeña y más grande. ¿Cuáles son 
los porcentajes de recorte correspondientes? ¿Cómo se 
comparan los valores de estas medias recortadas a las 
medias y medianas correspondientes? 

35. La presión de inyección mínima (lb/pulg 2 ) de especímenes 
moldeados por inyección de fécula de maíz se determinó 


con ocho especímenes diferentes (la presión más alta co¬ 
rresponde a una mayor dificultad de procesamiento) y se 
obtuvieron las siguientes observaciones (tomadas de “Ther- 
moplastic Starch Blends with Polyethylene-Co-Vinyl Alco¬ 
hol: Processability and Physical Properties”, Polymer Engr. 
and Science, 1994: 17-23): 

15.0 13.0 18.0 14.5 12.0 11.0 8.9 8.0 

a. Determine los valores de la media muestral, la mediana 
muestral y la media 12.5% recortada y compare estos 
valores. 

b. ¿En cuánto se podría incrementar la observación de la 
muestra más pequeña, actualmente 8.0, sin afectar el va¬ 
lor de la mediana muestral? 

c. Suponga que desea los valores de la media y la mediana 
muéstrales cuando las observaciones están expresadas en 
kilogramos por pulgada cuadrada (kg/pulg 2 ) en lugar de 
lb/pulg 2 . ¿Es necesario volver a expresar cada observación 
en kg/pulg 2 o se pueden utilizar los valores calculados en 
el inciso a) directamente? [Sugerencia: 1 kg = 2.2 Ib.] 

36. Una muestra de 26 trabajadores de plataforma petrolera ma¬ 
rina tomaron parte en un ejercicio de escape y se obtuvieron 
los datos adjuntos de tiempo (s) para completar el escape 
(“Oxygen Consumption and Ventilation During Escape from 
an Offshore Platform”, Ergonomics, 1997: 281-292): 


389 

356 

359 

363 

375 

424 

325 

394 

402 

373 

373 

370 

364 

366 
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a. Construya una gráfica de tallo y hojas de los datos. ¿Có¬ 
mo sugiere la gráfica que la media y mediana muéstra¬ 
les se comparen? 

b. Calcule los valores de la media y mediana muéstrales 
[Sugerencia: Y,x¡ = 9638.] 

c. ¿En cuánto se podría incrementar el tiempo más largo, 
actualmente de 424, sin afectar el valor de la mediana 
muestral? ¿En cuánto se podría disminuir este valor sin 
afectar el valor de la mediana muestral? 

d. ¿Cuáles son los valores de x y 3c cuando las observacio¬ 
nes se reexpresan en minutos? 

37. El artículo (“Snow Cover and Temperature Relationships in 
North America and Eurasia”, J. Climate and Applied Me- 
teorology, 1983: 460-469) utilizó técnicas estadísticas para 
relacionar la cantidad de cobertura de nieve sobre cada 
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continente para promediar la temperatura continental. Los 
datos allí presentados incluyeron las siguientes diez obser¬ 
vaciones de la cobertura de nieve en octubre en Eurasia du¬ 
rante los años 1970-1979 (en millones de km 2 ): 

6.5 12.0 14.9 10.0 10.7 7.9 21.9 12.5 14.5 9.2 

¿Qué reportaría como valor representativo, o típico de co¬ 
bertura de nieve en octubre durante este periodo y qué mo¬ 
tivaría su elección? 

38. Los valores de presión sanguínea a menudo se reportan a 
los 5 mmHg más cercanos (100, 105, 110, etc.). Suponga 
que los valores de presión sanguínea reales de nueve indivi¬ 
duos seleccionados al azar son 

118.6 127.4 138.4 130.0 113.7 122.0 108.3 

131.5 133.2 

a. ¿Cuál es la mediana de los valores de presión sanguínea 
reportados ? 

b. Suponga que la presión sanguínea del segundo indivi¬ 
duo es 127.6 en lugar de 127.4 (un pequeño cambio en 
un solo valor). ¿Cómo afecta esto a la mediana de los va¬ 
lores reportados? ¿Qué dice esto sobre la sensibilidad de 
la mediana al redondeo o agrupamiento en los datos? 

39. La propagación de grietas provocadas por fatiga en varias 
partes de un avión ha sido el tema de extensos estudios en 
años recientes. Los datos adjuntos se componen de vidas de 
propagación (horas de vuelo/10 4 ) para alcanzar un tamaño 
de agrietamiento dado en orificios para sujetadores utiliza¬ 
dos en aviones militares (“Statistical Crack Propagation in 
Fastener Holes ander Spectrum Loading”, J. Aircraft, 1983: 
1028-1032): 

0.736 0.863 0.865 0.913 0.915 0.937 0.983 1.007 

1.011 1.064 1.109 1.132 1.140 1.153 1.253 1.394 

a. Calcule y compare los valores de la media y mediana 
muéstrales. 

b. ¿En cuánto se podría disminuir la observación muestral 
más grande sin afectar el valor de la mediana? 

40. Calcule la mediana muestral, media 25% recortada, media 
10% recortada y media muestral de los datos de duración 
dados en el ejercicio 27 y compare estas medidas. 
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41. Se eligió una muestra de n = 10 automóviles y cada uno se 
sometió a una prueba de choque a 5 mph. Denotando un ca¬ 
rro sin daños visibles por S (por éxito) y un carro con daños 
por F, los resultados fueron los siguientes: 

SSFSSSFFSS 

a. ¿Cuál es el valor de la proporción muestral de éxitos 
xlril 

b. Reemplace cada S con 1 y cada F con 0. Acto seguido 
calcule x de esta muestra numéricamente codificada. 
¿Cómo se compara x con x/nl 

c. Suponga que se decide incluir 15 carros más en el expe¬ 
rimento. ¿Cuántos de éstos tendrían que ser S para dar 
x/n = 0.80 para toda la muestra de 25 carros? 

42. a. Si se agrega una constante c a cada x¡ en una muestra y 

se obtiene y¡ = x¡ + c, ¿cómo se relacionan la media 
y mediana muéstrales de las y¡ con la media y mediana 
muéstrales de las x¡? Verifique sus conjeturas, 
b. Si cada x¡ se multiplica por una constante c y se obtiene 
y¡ = cx¡, responda la pregunta del inciso a). De nuevo, 
verifique sus conjeturas. 

43. Un experimento para estudiar la duración (en horas) de 
un cierto tipo de componente implicaba poner diez 
componentes en operación y observarlos durante 100 ho¬ 
ras. Ocho de ellos fallaron durante dicho periodo y se re¬ 
gistraron las duraciones. Denote las duraciones de dos 
componentes que continuaron funcionando después 
de 100 horas por 100 + . Las observaciones muéstrales re¬ 
sultantes fueron: 

48 79 100+ 35 92 86 57 100+ 17 29 

¿Cuáles de las medidas del centro discutidas en esta sección 
pueden ser calculadas y cuáles son los valores de dichas 
medidas? [Nota: Se dice que los datos obtenidos con este 
experimento están “censurados a la derecha”.] 


1.4 Medidas de variabilidad 

El reporte de una medida de centro da sólo información parcial sobre un conjunto o distri¬ 
bución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de cen¬ 
tro y aún diferir entre sí en otras importantes maneras. La figura 1.17 muestra gráficas de 
puntos de tres muestras con las mismas media y mediana, aunque el grado de dispersión en 

2: O O OOOOO O O 

3: O O OOOOO O O 


30 40 50 60 70 

Figura 1.17 Muestras con medidas idénticas de centro pero diferentes cantidades de variabilidad. 
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torno al centro es diferente para las tres muestras. La primera tiene la cantidad más grande 
de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia con res¬ 
pecto a las otras dos. 

Medidas de variabilidad de datos muéstrales 

La medida más simple de variabilidad en una muestra es el rango, el cual es la diferencia 
entre los valores muéstrales más grande y más pequeño. El valor del rango de la muestra 1 en 
la figura 1.17 es mucho más grande que el de la muestra 3, lo que refleja más variabilidad 
en la primera muestra que en la tercera. Un defecto del rango, no obstante, es que depende 
de sólo las dos observaciones más extremas y hace caso omiso de las posiciones de los n - 2 
valores restantes. Las muestras 1 y 2 en la figura 1.17 tienen rangos idénticos, aunque cuan¬ 
do se toman en cuenta las observaciones entre los dos extremos, existe mucho menos varia¬ 
bilidad o dispersión en la segunda muestra que en la primera. 

Las medidas principales de variabilidad implican las desviaciones de la media, 
x¡ — x, x 2 — x, . . ., x n — x. Es decir, las desviaciones de la media se obtienen restando x de 
cada una de la n observaciones muéstrales. Una desviación será positiva si la observación 
es más grande que la media (a la derecha de la media sobre el eje de medición) y negativa 
si la observación es más pequeña que la media. Si todas las desviaciones son pequeñas en 
magnitud, entonces todas las x¡ se aproximan a la media y hay poca variabilidad. Alternati¬ 
vamente, si algunas de las desviaciones son grandes en magnitud, entonces algunas x¡ que¬ 
dan lejos de x lo que sugiere una mayor cantidad de variabilidad. Una forma simple de 
combinar las desviaciones en una sola cantidad es promediarlas. Desafortunadamente, esto 
es una mala idea: 

n 

suma de desviaciones = X (x¡ — x) = 0 

i'=l 

por lo que la desviación promedio siempre es cero. La verificación utiliza varias reglas es¬ 
tándar y el hecho de que Y,x = x + x + ■ • ■ + x = ruc: 

— x)= X-L — X* = ^.X: — tix = X v, — —Xl-] — 0 

\n ) 

¿Cómo se puede evitar que las desviaciones negativas y positivas se neutralicen entre sí 
cuando se combinan? Una posibilidad es trabajar con los valores absolutos de las desviacio¬ 
nes y calcular la desviación absoluta promedio 2 | x¡ — x \ ln. Como la operación de valores 
absolutos conduce a dificultades teóricas, considérense en cambio las desviaciones al cua¬ 
drado (X] — x )\ (x 2 — x) 2 , , (x n — x ) 2 . En vez de utilizar la desviación al cuadrado pro¬ 

medio Yj(x¡ — x) 2 ln, por varias razones se divide la suma de desviaciones al cuadrado 
entre n — 1 en lugar de entre n. 


DEFINICIÓN 


La varianza muestral, denotada por s 2 está dada por 

, X(*¡ - x) 2 S xx 

s = -=- 

n — 1 n — 1 

La desviación estándar muestral, denotada por s, es la raíz cuadrada (positiva) de la 
varianza 

s = Vs 2 


Obsérvese que s 2 y s son no negativas. La unidad de s es la misma que la de cada una de las 
jc ; . Si por ejemplo, las observaciones son eficiencias de combustible en millas por galón, en¬ 
tonces se podría tener s = 2.0 mpg. Una interpretación preliminar de la desviación estándar 





















cl_p001-045.qxd 


3/12/08 


2:31 ffl Page 33 




1.4 Medidas de variabilidad 33 

muestral es que es el tamaño de una desviación típica o representativa de la media muestral 
dentro de la muestra dada. Por tanto si s = 2.0 mpg, entonces algunas x¡ en la muestra se 
aproximan más que 2.0 a x, en tanto que otras están más alejadas; 2.0 es una desviación re¬ 
presentativa (o “estándar”) de la eficiencia de combustible media. Si s = 3.0 de una segunda 
muestra de carros de otro tipo, una desviación típica en esta muestra es aproximadamente 1.5 
veces la de la primera muestra, una indicación de más variabilidad en la segunda muestra. 

Ejemplo 1.15 La resistencia es una característica importante de los materiales utilizados en casas prefabri¬ 
cadas. Cada uno de n = 11 elementos de placa prefabricados se sometieron a prueba de es¬ 
fuerzo severo y se registró el ancho máximo (mm) de las grietas resultantes. Los datos 
proporcionados (tabla 1.3) aparecieron en el artículo (“Prefabricated Ferrocement Ribbed 
Elements for Low-Cost Housing”, J. Ferrocement , 1984: 347-364). 


Tabla 1.3 Datos del ejemplo 1.15 


X¡ 

X¡ — X 

(*, - *) 2 

0.684 

-0.9841 

0.9685 

2.540 

0.8719 

0.7602 

0.924 

-0.7441 

0.5537 

3.130 

1.4619 

2.1372 

1.038 

-0.6301 

0.3970 

0.598 

-1.0701 

1.1451 

0.483 

-1.1851 

1.4045 

3.520 

1.8519 

3.4295 

1.285 

-0.3831 

0.1468 

2.650 

0.9819 

0.9641 

1.497 

-0.1711 

0.0293 

2>,. = 18.349 

2(x¡ - x) = -0.0001 

S xx = 'Z(x i -x) 2 = 11.9359 

3c = 18.349/11 = 1.6681 




Los efectos de redondeo hacen que la suma de las desviaciones no sea exactamente cero. 
El numerador de s 2 es 11.9359, por consiguiente s 2 = 11.9359/(11 — 1) = 11.9359/10 = 
1.19359 y s = Vi. 19359 = 1.0925 mm. ■ 

Motivación para s 2 

Para explicar el porqué del divisor n — 1 en s 2 , obsérvese primero que en tanto que s 2 mide 
la variabilidad muestral, existe una medida de variabilidad en la población llamada varianza 
poblacional. Se utilizará cr 2 (el cuadrado de la letra griega sigma minúscula) para denotar la 
varianza poblacional y cr para denotar la desviación estándar poblacional (la raíz cuadrada de 
o -2 ). Cuando la población es finita y se compone de N valores, 

N 

(T 2 =2 (X¡ ~ lx) 2 /N 
i= 1 

la cual es el promedio de todas las desviaciones al cuadrado con respecto a la media poblacio¬ 
nal (para la población, el divisor esNy noN - 1). En los capítulos 3 y 4 aparecen definiciones 
más generales de cr 2 . 

Así como x se utilizará para hacer inferencias sobre la media poblacional /i, se de¬ 
berá definir la variancia muestral de modo que pueda ser utilizada para hacer inferencias 
sobre cr 2 . Ahora obsérvese que cr 2 implica desviaciones cuadradas con respecto a la me¬ 
dia poblacional ¡x. Si en realidad se conociera el valor de ¡x, entonces se podría definir la 
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varianza muestral como la desviación al cuadrado promedio de las x¡ de la muestra con 
respecto a p . Sin embargo, el valor de p casi nunca es conocido, por lo que se debe uti¬ 
lizar el cuadrado de la suma de las desviaciones con respecto a x. Pero las x¡ tienden a 
acercarse más a su valor promedio que el promedio poblacional p, así que para compen¬ 
sar esto se utiliza el divisor n - 1 en lugar de n. En otras palabras, si se utiliza un divisor 
n en la varianza muestral, entonces la cantidad resultante tendería a subestimar cr 2 (se pro¬ 
ducen valores demasiado pequeños en promedio), mientras que si se divide entre el divi¬ 
sor un poco más pequeño n - 1 se corrige esta subestimación. 

Se acostumbra referirse a s 2 que está basada en n - 1 grados de libertad (gl o df, por 
sus siglas en inglés). Esta terminología se deriva del hecho de que aunque s 2 está basada en 
las n cantidades x l — x, x 2 — x, . . . , x n — x, éstas suman 0, por lo que al especificar los 
valores de cualquier n — 1 de las cantidades se determina el valor restante. Por ejemplo, si 
n = 4 y Xj — 3c = 8, x 2 ~ x = — 6 y x 4 — x = —4, entonces automáticamente x 3 — x = 2, 
así que sólo tres de los cuatro valores de x¡ — x son libremente determinados (3 gl). 

Una fórmula para calcular s 2 

Es mejor obtener s 2 con software estadístico o bien utilizar una calculadora que permita in¬ 
gresar datos en la memoria y luego ver s 2 con un solo golpe de tecla. Si su calculadora no 
tiene esta capacidad, existe una fórmula alternativa para S xx que evita calcular las desviacio¬ 
nes. La fórmula implica sumar (2x,) , sumar y luego elevar al cuadrado y 2-c 2 , elevar al 
cuadrado y sumar. 



Una alternativa para el numerador de s 2 es 


s xx = “ *) 2 = 


Q>,) 


2 


n 



Comprobación Como x = 2 x/n, nx 2 = (Zx¡)~/n. Entonces 

Xth - x) 2 = 2(* 2 _ 2x • x¡ + x 2 ) = X* 2 - 2xX-h + X(^) 2 
= ¿,x¡ — 2x ■ nx + n(x) 2 = Z^x 2 ¡ — n(x) 2 


Ejemplo 1.16 La cantidad de luz reflejada por las hojas ha sido utilizada para varios propósitos, incluidas la 
evaluación del color del césped, la estimación del estado del nitrógeno y la medición de la bio- 
masa. El artículo (“Leaf Reflectance-Nitrogen-Chlorophyll Relations in Buffel-Grass”, Pho- 
togrammetric Engr. and Remóte Sensing, 1985: 463-466) dio las siguientes observaciones 
obtenidas por medio de espectrofotogrametría, de la reflexión de las hojas en condiciones ex¬ 
perimentales. 


Observación 

x i 


Observación 

x i 

X j 

1 

15.2 

231.04 

9 

12.7 

161.29 

2 

16.8 

282.24 

10 

15.8 

249.64 

3 

12.6 

158.76 

11 

19.2 

368.64 

4 

13.2 

174.24 

12 

12.7 

161.29 

5 

12.8 

163.84 

13 

15.6 

243.36 

6 

13.8 

190.44 

14 

13.5 

182.25 

7 

16.3 

265.69 

15 

12.9 

166.41 

8 

13.0 

169.00 








= 216.1 

2>7= 3168.13 
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La fórmula de cálculo ahora da 

S„ = Zx 2 -^~ = 3168.13 
= 3168.13 

con la cual í 2 = SJ(n - 1) = 54.85/14 = 3.92 

Tanto la fórmula definitoria como la de cálculo para s 2 pueden ser sensibles al redondeo, por 
lo que en los cálculos intermedios se deberá usar tanta precisión decimal como sea posible. 
Algunas otras propiedades de s 2 pueden mejorar el entendimiento y facilitar el cálculo. 


Sean x u x 2 , . . . , x n una muestra y c cualquier constante no cero. 

1. Si y l = x¡ + c, y 2 = x 2 + c, . . . , y n = x n + c, entonces s 2 = s 2 , y 

2. Si y¡ = cx v . . . , y n = cx n , entonces s 2 = c 2 s 2 , s y = \ c \ s x , 

donde s 2 x es la varianza muestral de las x y s 2 es la varianza muestral de las y. 


(216.1) 2 

15 

- 3113.28 = 54.85 

y s = 1.98. ■ 


En palabras, el resultado 1 dice que si se suma una constante c (o resta) de cada valor de dato, 
la varianza no cambia. Esto es intuitivo, puesto que la adición o sustracción de c cambia la 
localización del conjunto de datos pero deja las distancias iguales entre los valores de datos. 
De acuerdo con el resultado 2, la multiplicación de cada x¡ por c hace que s 2 sea multiplicada 
por un factor de c 2 . Estas propiedades pueden ser comprobadas al observar que en el resul¬ 
tado 1, y = x + c y que en el resultado 2, y = ex. 

Gráficas de caja 

Las gráficas de tallo y hojas e histogramas transmiten impresiones un tanto generales sobre 
un conjunto de datos, mientras que un resumen único tal como la media o la desviación están¬ 
dar se enfoca en sólo un aspecto de los datos. En años recientes, se ha utilizado con éxito un 
resumen gráfico llamado gráfica de caja para describir varias de las características más pro¬ 
minentes de un conjunto de datos. Estas características incluyen 1) el centro, 2) la disper¬ 
sión, 3) el grado y naturaleza de cualquier alejamiento de la simetría y 4) la identificación 
de las observaciones “extremas o apartadas” inusualmente alejadas del cuerpo principal de los 
datos. Como incluso un solo valor extremo puede afectar drásticamente los valores de x y s, 
una gráfica de caja está basada en medidas “resistentes” a la presencia de unos cuantos valo¬ 
res apartados, la mediana y una medida de variabilidad llamada dispersión de los cuartos. 


Se ordenan las observaciones de la más pequeña a la más grande y se separa la mitad 
más pequeña de la más grande; se incluye la mediana x en ambas mitades si n es im¬ 
par. En tal caso el cuarto inferior es la mediana de la mitad más pequeña y el cuar¬ 
to superior es la mediana de la mitad más grande. Una medida de dispersión que es 
resistente a los valores apartados es la dispersión de los cuartos /j, dada por 

f s = cuarto superior - cuarto inferior 



En general, la dispersión de los cuartos no se ve afectada por las posiciones de las observa¬ 
ciones comprendidas en el 25% más pequeño o el 25% más grande de los datos. Por consi¬ 
guiente es resistente a valores apartados. 

La gráfica de caja más simple se basa en el siguiente resumen de cinco números: 
x¡ más pequeñas cuarto inferior mediana cuarto superior x¡ más grandes 
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Primero, se traza una escala de medición horizontal. Luego se coloca un rectángulo sobre es¬ 
te eje; el lado izquierdo del rectángulo está en el cuarto inferior y el derecho en el cuarto su¬ 
perior (por lo que el ancho de la caja = fj. Se coloca un segmento de línea vertical o algún 
otro símbolo dentro del rectángulo en la ubicación de la mediana; la posición del símbolo de 
mediana con respecto a los dos lados da información sobre asimetría en el 50% medio de los 
datos. Por último, se trazan “bigotes” hacia fuera de ambos extremos del rectángulo hacia las 
observaciones más pequeñas y más grandes. También se puede trazar una gráfica de caja con 
orientación vertical mediante modificaciones obvias en el proceso de construcción. 

Ejemplo 1.17 Se utilizó ultrasonido para reunir los datos de corrosión adjuntos de la placa de piso de un 
tanque elevado utilizado para almacenar petróleo crudo (“Statistical Analysis of UT Corro¬ 
sión Data from Floor Plates of a Crude Oil Aboveground Storage Tank”, Materials Eval., 
1994: 846-849); cada observación es la profundidad de picadura más grande en la placa, ex¬ 
presada en milésimas de pulgada. 


40 52 55 60 70 75 85 85 90 90 92 94 94 95 98 100 115 125 125 


El resumen de cinco números es como sigue: 

x¡ más pequeña = 40 cuarto inferior = 72.5 x = 90 cuarto superior = 96.5 
x¡ más grande =125 

La figura 1.18 muestra la gráfica de caja resultante. El lado derecho de la caja está mucho 
más cerca a la mediana que el izquierdo, lo que indica una asimetría sustancial en la mitad 
derecha de los datos. El ancho de la caja (f s ) también es razonablemente grande con respec¬ 
to al rango de datos (distancia entre las puntas de los bigotes). 




O 


—-— -1-- I I — — Profundidad 

40 50 60 70 80 90 100 110 120 130 

Figura 1.18 Gráfica de caja de los datos de corrosión. 

La figura 1.19 muestra los resultados obtenidos con MINITAB en respuesta a la pe¬ 
tición de describir los datos de corrosión. La media recortada es el promedio de las 17 ob¬ 
servaciones que permanecen después de eliminar los valores más grandes y más pequeños 
(porcentaje de recorte ~ 5%), Q1 y Q3 son los cuartiles inferior y superior; éstos son si¬ 
milares a los cuartos pero se calculan de una manera diferente; el error estándar promedio 
(SE Mean) es sA/ñ; esta será una importante cantidad en el trabajo subsiguiente con res¬ 
pecto a inferencias en torno a ¡i. 

Profundidad N Media Media Media recortada Desv. estándar Media SE 
variable 19 86.32 90.00 86.76 23.32 5.35 

Profundidad Mínima Máxima Q1 Q3 

variable 40.00 125.00 70.00 98.00 

Figura 1.19 Descripción de MINITAB de los datos de profundidad de picaduras. ■ 

Gráficas de caja que muestran valores apartados 

Una gráfica de caja puede ser embellecida para indicar explícitamente la presencia de valo¬ 
res apartados. Muchos procedimientos inferenciales se basan en la suposición de que la dis¬ 
tribución de la población es normal (un cierto tipo de curva en forma de campana). Incluso 
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Ejemplo 1.18 


e 
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Cualquier observación a más de 1.5 f s del cuarto más cercano es un valor apartado (o 
atípico). Un valor apartado es extremo si se encuentra a más de 3 f s del cuarto más 
cercano y moderado de lo contrario. 


un solo valor apartado extremo que aparezca en la muestra advierte al investigador que ta¬ 
les procedimientos pueden ser no confiables y la presencia de varios valores apartados trans¬ 
mite el mismo mensaje. 

Modifiqúese ahora la construcción previa de una gráfica de caja trazando un bigote que 
sale de cada extremo de la caja hacia las observaciones más pequeñas y más grandes que no 
son valores apartados. Cada valor apartado moderado está representado por un círculo cerra¬ 
do y cada valor apartado extremo por uno abierto. Algunos programas de computadora es¬ 
tadísticos no distinguen entre valores apartados moderados y extremos. 

Los efectos de descargas parciales en la degradación de materiales para cavidades aislantes 
tienen implicaciones importantes en relación con las duraciones de componentes de alto vol¬ 
taje. Considérese la siguiente muestra de n = 25 anchos de pulso de descargas lentas en una 
cavidad cilindrica de polietileno. (Estos datos son consistentes con un histograma de 250 
observaciones en el artículo “Assessment of Dielectric Degradation by Ultrawide-band PD 
Detection”, IEEE Trans. on Dielectrícs and Elec. Insul., 1995: 744-760.) El autor del artícu¬ 
lo señala el impacto de una amplia variedad de herramientas estadísticas en la interpretación 
de datos de descarga. 

5.3 8.2 13.8 74.1 85.3 88.0 90.2 
94.9 95.5 95.8 95.9 96.6 96.7 98.1 

Las cantidades pertinentes son 

x = 94.8 cuarto inferior = 90.2 

fs = 6.5 1.5/, = 9.75 

Por lo tanto, cualquier observación menor que 90.2 — 9.75 = 80.45 o mayor que 96.7 + 
9.75 = 106.45 es un valor apartado. Hay un valor apartado en el extremo superior de la 
muestra y cuatro en el extremo inferior. Debido a que 90.2 — 19.5 = 70.7, las tres observa¬ 
ciones 5.3, 8.2 y 13.8 son valores apartados extremos; los otros dos son moderados. Los bi¬ 
gotes se extienden a 85.3 y 106.0, las observaciones más extremas que no son valores 
apartados. La gráfica de caja resultante aparece en la figura 1.20. Existe una gran cantidad 
de asimetría negativa en la mitad media de la muestra así como también en toda la muestra. 
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- ' - ' - ' -► Ancho de pulso 

0 50 100 

Figura 1.20 Gráfica de caja de los datos de ancho de pulso que muestra valores apartados mo¬ 
derados y extremos. ■ 

Gráficas de caja comparativas 

Una gráfica de caja comparativa o lado a lado es una forma muy efectiva de revelar similitu¬ 
des y diferencias entre dos o más conjuntos de datos compuestos de observaciones de la mis¬ 
ma variable, observaciones de eficiencia de consumo de combustible de cuatro tipos distintos 
de automóviles, rendimientos de cosechas de tres variedades diferentes y así sucesivamente. 
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Ejemplo 1.19 En años recientes, algunas evidencias sugieren que las altas concentraciones de radón bajo 
techo pueden estar ligadas al desarrollo de cánceres en niños, pero muchos profesionales de 
la salud aún no están convencidos. Un artículo reciente (“Indoor Radon and Childhood Cán¬ 
cer”, The Lancet. 1991: 1537-1538) presentó los datos adjuntos sobre concentración de ra¬ 
dón (Bq/m 3 ) en dos muestras diferentes de casas. La primera consistió en casas en las cuales 
un niño diagnosticado con cáncer había estado residiendo. Las casas en la segunda muestra 
no incluían casos registrados de cáncer infantil. La figura 1.21 presenta una gráfica de tallo 
y hojas de los datos. 


1. Con cáncer 


2. Sin cáncer 

9683795 
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95768397678993 

86071815066815233150 
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12271713114 

12302731 
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3 
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7 

5 

55 


6 



7 

Tallo: dígitos de decenas 

HI: 210 

8 

5 Hojas: dígitos de unidades 


Figura 1.21 Gráfica de tallo y hojas del ejemplo 1.19. 
El resumen de cantidades numéricas es el siguiente: 



X 

X 

s 

fs 

Con cáncer 

22.8 

16.0 

31.7 

11.0 

Sin cáncer 

19.2 

12.0 

17.0 

18.0 


O 


Los valores tanto de la media como de la mediana sugieren que la muestra de cáncer se en¬ 
cuentra en el centro un poco a la derecha de la muestra sin cáncer sobre la escala de medi¬ 
ción. La media, sin embargo, exagera la magnitud de este desplazamiento, en gran medida 
debido a la observación 210 en la muestra con cáncer. Los valores de s sugieren más varia¬ 
bilidad en la muestra con cáncer que en la muestra sin cáncer, pero las dispersiones de los 
cuartos contradicen esta impresión. De nuevo, la observación 210, un valor apartado extre¬ 
mo, es el culpable. La figura 1.22 muestra una gráfica de caja comparativa generada por el 


Concentración 
de radón 



Figura 1.22 Gráfica de caja de los datos del ejemplo 1.19, obtenida con S-Plus. 
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programa de computadora S-Plus. La caja sin cáncer aparece alargada en comparación con 
la caja con cáncer (f s = 18 vs.f s = 11) y las posiciones de las líneas medianas en las dos ca¬ 
jas muestran más asimetría en la mitad media de la muestra sin cáncer que la muestra con 
cáncer. Los valores apartados están representados por segmentos de línea horizontales y no 
hay distinción entre los valores apartados moderados y extremos. ■ 


EJERCICIOS Sección 1.4 (44-61) 


44 . El artículo (“Oxygen Consumption During Fire Suppres- 
sion: Error of Heart Rate Estimation”, Ergonomics, 1991: 
1469-1474) reportó los siguientes datos sobre consumo de 
oxígeno (ml/kg/min) para una muestra de diez bomberos 
que realizaron un simulacro de supresión de incendio. 

29.5 49.3 30.6 28.2 28.0 26.3 33.9 29.4 23.5 31.6 

Calcule lo siguiente: 

a. El rango muestral. 

b. La varianza muestral s 2 a partir de la definición (es de¬ 
cir, calculando primero las desviaciones y luego eleván¬ 
dolas al cuadrado, etcétera). 

c. La desviación estándar muestral. 

d. s 2 utilizando el método más corto. 

45 . Se determinó el valor del módulo de Young (GPa) de placas 
fundidas compuestas de ciertos sustratos intermetálicos y se 
obtuvieron las siguientes observaciones muéstrales 
(“Strength and Modulus of a Molybdenum-Coated Ti- 
25Al-10Nb-3U-lMo Intermetallic”, J. of Materials Engr. 
and Performance, 1997: 46-50): 

116.4 115.9 114.6 115.2 115.8 

a. Calcule x y las desviaciones de la media. 

b. Use las desviaciones calculadas en el inciso a) para 
obtener la varianza muestral y la desviación estándar 
muestral. 

c. Calcule s 2 utilizando la fórmula para el numerador S^. 

d. Reste 100 de cada observación para obtener una mues¬ 
tra de valores transformados. Ahora calcule la varianza 
muestral de estos valores transformados y compárela 
con s 2 de los datos originales. 

46 . Las observaciones adjuntas de viscosidad estabilizada (cP) 
realizadas en probetas de un cierto grado de asfalto con 
18% de caucho agregado se tomaron del artículo (“Visco- 
sity Characteristics of Rubber-Modified Asphalts”, J. of 
Materials in Civil Engr: 1996: 153-156): 

2781 2900 3013 2856 2888 

a. ¿Cuáles son los valores de la media y mediana mués¬ 
trales? 

b. Calcule la varianza muestral por medio de la fórmula de 
cálculo. [ Sugerencia : Primero reste un número conve¬ 
niente de cada observación.] 

47 . Calcule e interprete los valores de la mediana muestral, la 
media muestral y la desviación estándar muestral de las si¬ 
guientes observaciones de resistencia a la fractura (MPa, 


leídas en una gráfica que aparece en el artículo (“Heat-Re- 
sistant Active Brazing of Silicon Nitride: Mechanical Eva- 
luation of Braze Joints”, Welding J., agosto de 1997): 

87 93 96 98 105 114 128 131 142 168 

48 . El ejercicio 34 presentó los siguientes datos sobre concentra¬ 
ción de endotoxina en polvo asentado, obtenidos con una 
muestra de casas urbanas y una muestra de casas campestres: 

U: 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0 

C: 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0 
9.2 3.0 2.0 0.3 

a. Determine el valor de la desviación estándar muestral de 
cada muestra, interprete estos valores y luego contraste 
la variabilidad en las dos muestras. [ Sugerencia: Y,x¡ = 
237.0 para la muestra urbana y = 128.4 para la muestra 
campestre y Y,x 2 = 10 079 para la muestra urbana y 
1617.94 para la muestra campestre.] 

b. Calcule la dispersión de los cuartos de cada muestra y 
compare. ¿Transmiten el mismo mensaje las dispersio¬ 
nes de los cuartos sobre la variabilidad que las desvia¬ 
ciones estándar? Explique. 

c. Los autores del artículo citado también proporcionan 
concentraciones de endotoxina en el polvo presente en 
bolsas captadoras de polvo: 

U: 34.0 49.0 13.0 33.0 24.0 24.0 35.0 104.0 34.0 40.0 38.0 1.0 

C: 2.0 64.0 6.0 17.0 35.0 11.0 17.0 13.0 5.0 27.0 23.0 
28.0 10.0 13.0 0.2 

Construya una gráfica de caja comparativa (como se hizo en 
el artículo citado) y compare y contraste las cuatro muestras. 

49 . Un estudio de la relación entre edad y varias funciones vi¬ 
suales (tales como agudeza y percepción de profundidad) 
reportó las siguientes observaciones de área de la lámina es¬ 
clerótica (mm 2 ) de las cabezas del nervio óptico humano 
(“Morphometry of Nerve Fiber Bundle Pores in the Optic 
Nerve Head of the Human”, Experimental Eye Research, 
1988: 559-568): 

2.75 2.62 2.74 3.85 2.34 2.74 3.93 4.21 3.88 

4.33 3.46 4.52 2.43 3.65 2.78 3.56 3.01 

a. Calcule ~Zx ¡ y ~Zx¡. 

b. Use los valores calculados en el inciso a) para calcular la 
varianza muestral s 2 y luego la desviación estándar mues¬ 
tral s. 

50 . En 1997, una mujer demandó a un fabricante de teclados de 
computadora y lo acusó de que sus repetitivas lesiones por 
esfuerzo eran provocadas por el teclado (Genessy v. Digital 
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Equipment Corp.). El jurado adjudicó $3.5 millones por el 
dolor y sufrimiento pero la corte anuló dicha adjudicación 
por considerarla una compensación irrazonable. Al hacer es¬ 
ta determinación, la corte identificó un grupo “normativo” de 
27 casos similares y especificó una adjudicación razonable 
como una dentro de dos desviaciones estándar de la media 
de las adjudicaciones en los 27 casos. Las 27 adjudicaciones 
fueron (en el rango de los $1000) 37, 60, 75, 115, 135, 140, 
149,150, 238, 290, 340,410, 600,750,750, 750, 1050,1100, 
1139, 1150, 1200, 1200, 1250, 1576, 1700, 1825 y 2000 con 
las cuales 'Z.x i = 20179, ’Z.xf = 24 657 511. ¿Cuál es la can¬ 
tidad máxima posible que podría ser adjudicada conforme a 
la regla de dos desviaciones estándar? 

51 . El artículo (“A Thin-Film Oxygen Uptake Test for the Eva- 
luation of Automotive Crankcase Lubricants”, Lubric. Engr., 
1984: 75-83) reportó los siguientes datos sobre tiempo de in¬ 
ducción de oxidación (min) de varios aceites comerciales: 

87 103 130 160 180 195 132 145 211 105 145 

153 152 138 87 99 93 119 129 

a. Calcule la varianza muestral y la desviación estándar. 

b. Si las observaciones se volvieran a expresar en horas, 
¿cuáles serían los valores resultantes de la varianza de la 
muestra y la desviación estándar muestral? Responda 
sin realizar en realidad la reexpresión. 

52 . Las primeras cuatro desviaciones de la media en una mues¬ 
tra de n = 5 tiempos de reacción fueron 0.3, 0.9, 1.0 y 1.3. 
¿Cuál es la quinta desviación de la media? Dé una muestra 
para la cual estas son las cinco desviaciones de la media. 

53 . Reconsidere los datos sobre el área de lámina esclerótica 
dados en el ejercicio 49. 

a. Determine los cuartos inferior y superior. 

b. Calcule el valor de la dispersión de los cuartos. 

c. Si los dos valores muéstrales más grandes, 4.33 y 4.52 
hubieran sido 5.33 y 5.52, ¿cómo afectaría esto a fp. Ex¬ 
plique. 

d. ¿En cuánto se podría incrementar la observación 2.34 
sin afectar a fp Explique. 

e. Si la 18a. observación, x 18 = 4.60, se suma a la muestra, 
¿cuál es fp 

54 . Considere las siguientes observaciones sobre resistencia al es¬ 
fuerzo cortante (MPa) de una junta unida de una manera par¬ 
ticular (tomadas de una gráfica que aparece en el artículo 
(“Diffusion of Silicon Nitride to Austenitic Stainless Steel 
without Interlayers”, Metallurgical Trans., 1993: 1835-1843). 

22.2 40.4 16.4 73.7 36.6 109.9 

30.0 4.4 33.1 66.7 81.5 

a. ¿Cuáles son los valores de los cuartos y cuál es el valor 
de/,? 

b. Construya una gráfica de caja basada en el resumen de 
cinco números y comente sobre sus características. 

c. ¿Qué tan grande o pequeña tiene que ser una observa¬ 
ción para calificar como valor apartado? ¿Como valor 
apartado extremo? 

d. ¿En cuánto podría disminuir la observación más grande 
sin afectar/,? 


55. He aquí una gráfica de tallo y hojas de los datos de tiempo 
de escape introducidos en el ejercicio 36 de este capítulo. 
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a. Determine el valor de la dispersión de los cuartos. 

b. ¿Hay algunos valores apartados en la muestra? ¿Algu¬ 
nos valores apartados extremos? 

c. Construya una gráfica de caja y comente sobre sus ca¬ 
racterísticas. 

d. ¿En cuánto se podría disminuir la observación más gran¬ 
de, actualmente de 424, sin afectar el valor de la disper¬ 
sión de los cuartos? 


56 . Se determinó la cantidad de contaminación por aluminio 
(ppm) en plástico de cierto tipo con una muestra de 26 probe¬ 
tas de plástico y se obtuvieron los siguientes datos (“The Log- 
normal Distribution for Modeling Quality Data when the 
Mean Is Near Zero”, / of Quality Technology , 1990: 105-110): 
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Construya una gráfica de caja que muestre valores aparta¬ 
dos y comente sobre sus características. 

57. Se seleccionó una muestra de 20 botellas de vidrio de un ti¬ 
po particular y se determinó la resistencia a la presión inter¬ 
na de cada botella. Considere la siguiente información 
parcial sobre la muestra: 
mediana = 202.2 cuarto inferior = 196.0 
cuarto superior = 216.8 

Las tres observaciones más pequeñas 125.8 188.1 193.7 
Las tres observaciones más grandes 221.3 230.5 250.2 


a. ¿Hay valores apartados en la muestra? ¿Algunos valores 
apartados extremos? 

b. Construya una gráfica de caja que muestre valores apar¬ 
tados y comente sobre cualesquiera características inte¬ 
resantes. 


58 . Una compañía utiliza dos máquinas diferentes para fabricar 
piezas de cierto tipo. Durante un solo turno, se obtuvo una 
muestra de n = 20 piezas producidas por cada máquina y se 
determinó el valor de una dimensión crítica particular de 
cada pieza. La gráfica de caja comparativa que aparece en 
la parte superior de la página 41 se construyó con los datos 
resultantes. Compare y contraste las dos muestras. 

59 . Se determinó la concentración de cocaína (mg/1) tanto con 
una muestra de individuos que murieron de delirio excitado 
(DE) inducido por el consumo de cocaína y con una mues¬ 
tra de aquellos que murieron de una sobredosis de cocaína sin 
delirio excitado; el tiempo de sobrevivencia de las personas 
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41 


Máquina 


Gráfica de caja comparativa del ejercicio 58 



Dimensión 


en ambos grupos fue a lo sumo de 6 horas. Los datos adjun¬ 
tos se tomaron de una gráfica de caja comparativa incluida en 
el artículo (“Fatal Excited Delirium Following Cocaine Use”, 
J. of Forensic Sciences, 1997: 25-31). 

Con DE 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.3 0.3 
0.3 0.4 0.5 0.7 0.8 1.0 1.5 2.7 2.8 
3.5 4.0 8.9 9.2 11.7 21.0 
Sin DE 0 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.2 
0.3 0.3 0.3 0.4 0.5 0.5 0.6 0.8 0.9 1.0 

1.2 1.4 1.5 1.7 2.0 3.2 3.5 4.1 

4.3 4.8 5.0 5.6 5.9 6.0 6.4 7.9 

8.3 8.7 9.1 9.6 9.9 11.0 11.5 

12.2 12.7 14.0 16.6 17.8 

a. Determine las medianas, cuartos y dispersiones de los 
cuartos de las dos muestras, 

b. ¿Existen algunos valores apartados en una u otra mues¬ 
tra? ¿Algunos valores apartados extremos? 

c. Construya una gráfica de caja comparativa y utilícela 
como base para comparar y contrastar las muestras con 
DE y sin DE. 


60 . 


Se obtuvieron observaciones de resistencia al estallamiento 
(lb/pulg 2 ) tanto con soldaduras de cierre de toberas de prueba 
como con soldaduras para toberas de envases de producción 
(“Proper Procedures Are the Key to Welding Radioactive 
Waste Cannisters”, Welding /., agosto de 1997: 61-67). 
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Construya una gráfica de caja comparativa y comente sobre 
las características interesantes (el artículo citado no incluía 
tal gráfica, pero los autores comentaron que habían visto 
uno.) 

61 . La gráfica de caja comparativa adjunta de coeficientes de 
vapor de gasolina de vehículos en Detroit apareció en el ar¬ 
tículo (“Receptor Modeling Approach to VOC Emission In- 
ventory Validation”, J. of Envir. Engr., 1995: 483-490). 
Discuta las características interesantes. 


Gráfica de caja comparativa del ejercicio 61 
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EJERCICIOS SUPLEMENTARIOS (62-83) 


62 . Considere la siguiente información sobre resistencia a la 
tensión final (lb/pulg) de una muestra de n = 4 probetas de 
alambre de cobre al zirconio duro (de “Characterization 
Methods for Fine Copper Wire”, Wire J. Intl., agosto de 
1997: 74-80): 

x = 76 831 s = 180, x¡ más pequeña = 76 683, 
x¡ más grande = 77 048. 

Determine los valores de las dos observaciones muéstrales in¬ 
termedias (;pero no lo haga mediante conjeturas sucesivas!) 

63 . La cantidad de radiación recibida en un invernadero desem¬ 
peña un importante papel al determinar el coeficiente de fo¬ 
tosíntesis. Las observaciones adjuntas sobre radiación solar 
incidente se leyeron en una gráfica que aparece en el artícu¬ 
lo (“Radiation Components over Bare Planted Soils in a 
Greenhouse”, Solar Energy, 1990: 1011-1016). 
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Use algunos de los métodos estudiados en este capítulo pa¬ 
ra describir y resumir estos datos. 


64 . Los siguientes datos sobre emisiones de F1C y CO de un ve¬ 
hículo particular se dieron en la introducción del capítulo. 

HC(g/ milla) 13.8 18.3 32.2 32.5 
CO(g/ milla) 118 149 232 236 

a. Calcule las desviaciones estándar muéstrales de las ob¬ 
servaciones de HC y CO. ¿Parece justificarse la creencia 
difundida? 

b. El coeficiente de variación maestral s/x (o 100 s/x) eva¬ 
lúa el grado de variabilidad con respecto a la media. Los 
valores de este coeficiente para varios conjuntos de da¬ 
tos diferentes pueden ser comparados para determinar 
cuáles conjuntos de datos exhiben más o menos varia¬ 
ción. Realice la comparación con los datos dados. 

65 . La distribución de frecuencia adjunta de observaciones de 
resistencia a la fractura (MPa) de barras de cerámicas coci¬ 
das en un horno particular apareció en el artículo (“Evalua- 
ting Tunnel Kiln Performance”, Amer. Ceramic Soc. Bull., 
agosto de 1997: 59-63). 

Frecuencia 81-<83 83-<85 85-<87 87-<89 89-<91 

de clase 6 7 17 30 43 

Frecuencia 91-<93 93-<95 95-<97 97-<99 

de clase 28 22 13 3 

a. Construya un histograma basado en frecuencias relati¬ 
vas y comente sobre cualesquiera características intere¬ 
santes. 

b. ¿Qué proporción de las observaciones de resistencia son 
por lo menos de 85? ¿Menores que 95? 

c. Aproximadamente, ¿qué proporción de las observacio¬ 
nes son menores que 90? 


66. Una deficiencia de indicios de selenio en la dieta puede im¬ 
pactar negativamente el crecimiento, la inmunidad, la función 
muscular y neuromuscular y la fertilidad. La introducción de 
suplementos de selenio en vacas lecheras se justifica cuan¬ 
do las pasturas contienen niveles bajos de selenio. Los au¬ 
tores del artículo (“Effects of Short-Term Supplementation 
with Selenised Yeast on Milk Production and Composition 
of Lactating Cows”, Australian J. of Dairy Tech., 2004: 
199-203) suministraron los siguientes datos sobre la con¬ 
centración de selenio en la leche (mg/1) obtenidos con una 
muestra de vacas a las que se les administró un suplemento 
de selenio y una muestra de control de vacas a las que no se 
les administró suplemento, tanto inicialmente como des¬ 
pués de un periodo de 9 días. 
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a. ¿Parecen ser similares las concentraciones iniciales de 
Se en las muestras de suplemento y en las de control? 
Use varias técnicas de este capítulo para resumir los da¬ 
tos y responder la pregunta planteada. 

b. De nuevo use métodos de este capítulo para resumir los 
datos y luego describa cómo los valores de concentra¬ 
ción de Se finales en el grupo de tratamiento difieren de 
aquellos en el grupo de control. 

67 . Estenosis aórtica se refiere al estrechamiento de la válvula aór¬ 
tica en el corazón. El artículo (“Correlation Analysis of Steno- 
tic Aortic Valve Flow Patterns Using Phase Constrast MRI”, 
Atináis ofBiomed. Engr., 2005: 878-887) dio los siguientes 
datos sobre el diámetro de la raíz aórtica (cm) y el género de 
una muestra de pacientes con varios grados de estenosis aórtica: 

H: 3.7 3.4 3.7 4.0 3.9 3.8 3.4 3.6 3.1 4.0 3.4 3.8 3.5 
M: 3.8 2.6 3.2 3.0 4.3 3.5 3.1 3.1 3.2 3.0 

a. Compare y contraste los diámetros observados en los 
dos géneros. 

b. Calcule una media 10% recortada de cada una de las dos 
muestras y compare las demás medidas centrales (de 
la muestra de hombre, se debe utilizar el método de in¬ 
terpolación mencionado en la sección 1.3). 
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68. a. ¿Con qué valor de c es mínima la cantidad 2(x ; — c) 2 ? 

[Sugerencia: Tome la derivada con respecto a c, iguale a 
0 y resuelva.] 

b. Utilizando el resultado del inciso a), ¿cuál de las dos 
cantidades Y.(x¡ — x) 1 y Y.(x¡ — pf 1 será más pequeña 
que la otra (suponiendo que x # ju,)? 

69. a. Sean ay b constantes y sea y¡ = ax¡ + b con i = 1,2,..., 

n. ¿Cuáles son las relaciones entre xyyy entre j- 2 y s 2 ? 
b. Una muestra de temperaturas para iniciar una cierta 
reacción química dio un promedio muestral (°C) de 87.3 
y una desviación estándar muestral de 1.04. ¿Cuáles son 
el promedio muestral y la desviación estándar medidos 
en °F? [Sugerencia: F = | C + 32.] 

70 . El elevado consumo de energía durante el ejercicio continúa 
después de que termina la sesión de entrenamiento. Debido 
a que las calorías quemadas por ejercicio contribuyen a la 
pérdida de peso y tienen otras consecuencias, es importante 
entender el proceso. El artículo (“Effect of Weight Training 73 . 
Exercise and Treadmill Exercise on Post-Exercise Oxygen 
Consumption”, Medicine and Science in Sports and Exerci¬ 
se, 1998: 518-522) reportó los datos adjuntos tomados de un 
estudio en el cual se midió el consumo de oxígeno (litros) de 
forma continua durante 30 minutos de cada uno de 15 suje¬ 
tos tanto después de un entrenamiento con pesas como des¬ 
pués de una sesión de ejercicio en una caminadora. 


Sujeto 

1 2 

3 

4 5 

6 

7 8 

9 



10 11 

12 

13 14 

15 




Peso (x) 

14.6 

14.4 

19.5 

24.3 

16.3 

22.1 



23.0 

18.7 

19.0 

17.0 

19.1 

19.6 



23.2 

18.5 

15.9 





Caminadora (y) 

11.3 

5.3 

9.1 

15.2 

10.1 

19.6 


20.8 

10.3 10.3 

2.6 

16.6 

22.4 


23.6 

12.6 

4.4 





a. Construya una gráfica de caja comparativa de las obser¬ 
vaciones del ejercicio con pesas y la caminadora y co¬ 
mente sobre lo que ve. 

b. Debido a que estos datos aparecen en pares (x, y), con 
mediciones de x y y de la misma variable en dos condi¬ 
ciones distintas, es natural enfocarse en las diferencias 
que existen en ellos: d í = x l - y v . . . , d n = x„ — y n . 
Construya una gráfica de caja de las diferencias mués¬ 
trales. ¿Qué sugiere la gráfica? 

71. La siguiente es una descripción dada por MINITAB de los 
datos de resistencia dados en el ejercicio 13. 

Med. Desv. Media 

Resistencia N Media Mediana rec. est. SE 
variable 153 135.39 135.40 135.41 4.59 0.37 

Resistencia Mínima Máxima Q1 Q3 

variable 122.20 147.70 132.95 138.25 

a. Comente sobre cualesquiera características interesantes 
(los cuartiles y los cuartos son virtualmente idénticos en 
este caso). 

b. Construya una gráfica de caja de los datos basada en los 
cuartiles y comente sobre lo que ve. 

72. Los desórdenes y síntomas de ansiedad con frecuencia pue¬ 
den ser tratados exitosamente con benzodiazepina. Se sabe 
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que los animales expuestos a estrés exhiben una disminu¬ 
ción de la ligadura de receptor de benzodiazepina en la cor¬ 
teza frontal. El artículo (“Decreased Benzodiazepine 
Receptor Binding in Prefrontal Cortex in Combat-Related 
Posttraumatic Stress Disorder”, Amer. J. of Psychiatry. 
2000: 1120-1126) describió el primer estudio de ligadura 
de receptor de benzodiazepina en individuos que sufren de 
PTSD. Los datos anexos sobre una medición de ligadura a 
receptor (volumen de distribución ajustado) se leyeron en 
una gráfica que aparece en el artículo. 

PTSD: 10, 20, 25, 28, 31, 35, 37, 38, 38, 39, 39, 

42, 46 

Saludables: 23, 39, 40, 41, 43, 47, 51, 58, 63, 66, 67, 
69, 72 

Use varios métodos de este capítulo para describir y resu¬ 
mir los datos. 

El artículo (“Can We Really Walk Straight?, Amer. J. of 
Physical Anthropology, 1992: 19-27) reportó sobre un ex¬ 
perimento en el cual a cada uno de 20 hombres saludables 
se les pidió que caminarán en línea recta como fuera posi¬ 
ble hacia un punto a 60 m de distancia a velocidad normal. 
Considérense las siguientes observaciones de cadencia (nú¬ 
mero de pasos por segundo): 

0.95 0.85 0.92 .95 0.93 0.86 1.00 0.92 0.85 0.81 

0.78 0.93 0.93 1.05 0.93 1.06 1.06 0.96 0.81 0.96 

Use los métodos desarrollados en este capítulo para resumir 
los datos; incluya una interpretación o discusión en los ca¬ 
sos en que sea apropiado. [Nota: El autor del artículo utili¬ 
zó un análisis estadístico un tanto complejo para concluir 
que las personas no pueden caminar en línea recta y sugirió 
varias explicaciones para esto.] 

74. La moda de un conjunto de datos numéricos es el valor que 
ocurre con más frecuencia en el conjunto. 

a. Determine la moda de los datos de cadencia dados en el 
ejercicio 73. 

b. Para una muestra categórica, ¿cómo definiría la catego¬ 
ría modal? 

75. Se seleccionaron especímenes de tres tipos diferentes de ca¬ 
ble y se determinó el límite de fatiga (Mpa) de cada espéci¬ 
men y se obtuvieron los datos adjuntos. 


Tipo 1 

350 

350 

350 

358 

370 

370 

370 

371 


371 

372 

372 

384 

391 

391 

392 


Tipo 2 

350 

354 

359 

363 

365 

368 

369 

371 


373 

374 

376 

380 

383 

388 

392 


Tipo 3 

350 

361 

362 

364 

364 

365 

366 

371 


377 

377 

377 

379 

380 

380 

392 



a. Construya una gráfica de caja comparativa y comente 
sobre las similitudes y diferencias. 

b. Construya un diagrama de caja comparativo (una gráfi¬ 
ca de puntos de cada muestra con una escala común). 
Comente sobre las similitudes y diferencias. 

c. ¿Da la gráfica de caja comparativa del inciso a) una eva¬ 
luación informativa de similitudes y diferencias? Expli¬ 
que su razonamiento. 
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CAPITULO 1 Generalidades y estadística descriptiva 


76. Las tres medidas de centro introducidas en este capítulo son 
las media, la mediana y la media recortada. Dos medidas de 
centro adicionales que de vez en cuando se utilizan son el 
rango medio, el cual es el promedio de las observaciones 
más pequeñas y más grandes y el cuarto medio, el cual es el 
promedio de los dos cuartos. ¿Cuál de estas medidas de 
centro son resistentes a los efectos de los valores apartados 
y cuáles no? Explique su razonamiento. 

77. Considere los siguientes datos sobre el tiempo de repara¬ 


81. 


ción activo (horas) de una muestra de n = 46 receptores de 
comunicaciones aerotransportados: 


0.2 

0.3 

0.5 

0.5 

0.5 

0.6 

0.6 

0.7 

0.7 

0.7 

0.8 

0.8 

0.8 

LO 

1.0 

1.0 

1.0 

1.1 

1.3 

1.5 

1.5 

1.5 

1.5 

2.0 

2.0 

2.2 

2.5 

2.7 

3.0 

3.0 

3.3 

3.3 

4.0 

4.0 

4.5 

4.7 

5.0 

5.4 

5.4 

7.0 

7.5 

8.8 

9.0 

10.3 

22.0 

24.5 




Construya lo siguiente: 

a. Una gráfica de tallo y hojas en la cual los dos valores 
más grandes se muestran por separado en la fila HI. 

b. Un histograma basado en seis intervalos de clase con 0 
como el límite inferior del primer intervalo y anchos de 
intervalo de 2, 2, 2, 4, 10 y 10, respectivamente. 

78. Considere una muestra x¡, x 2 , ..., x n y suponga que los va¬ 
lores de x, s 2 y s han sido calculados. 

a. Sea y¡ = x¡ — x con i = 1 , ... ,n. ¿Cómo se comparan 
los valores de s 2 y de las y i con los valores correspon¬ 
dientes de las xp. Explique. 

b. Sea z¡ = ( x¡ — x)/s con i = 1,..., n. ¿Cuáles son los va¬ 
lores de la varianza muestral y la desviación estándar 
muestral de las zp 

79. Si x n y s 2 n denotan la media y la varianza de la muestra 
jCj, . . . , x n y si x n+1 y sj| +1 denotan estas cantidades cuando 
se agrega una observación adicional x„ +1 a la muestra. 

a. Demuestre cómo se puede calcular x n+¡ con x n y x n+l . 

b. Demuestre que 

nS n + l = (n - 'K + —777^+1 - xf 

de modo que s^ +l pueda ser calculada con x n+1 , x n , y s 

c. Suponga que una muestra de 15 torzales de hilo para te¬ 
las dio por resultado un alargamiento del hilo mediano 
muestral de 12.58 mm y una desviación estándar mues¬ 
tral de 0.512 mm. ¿Cuáles son los valores de la media 
muestral y la desviación estándar muestral de las 16 ob¬ 
servaciones de alargamiento? 

80. Las distancias de recorrido de rutas de autobuses de cual¬ 
quier sistema de tránsito particular por lo general varían de 
una ruta a otra. El artículo (“Planning of City Bus Routes”, 
J. of the Institution of Engineers, 1995: 211-215) da la si¬ 
guiente información sobre las distancias (km) de un sistema 
particular. 


Distancia 

6-<8 

8-<10 

10—< 12 

12-C14 

14—< 16 

Frecuencia 

6 

23 

30 

35 

32 

Distancia 

16—< 18 

18-<20 

20-<22 

22-<24 

24-<26 

Frecuencia 

48 

42 

40 

28 

27 

Distancia 

26-<28 

28-<30 

30-<35 

35-<40 

40~<45 

Frecuencia 

26 

14 

27 

11 

2 


a. Trace un histograma correspondiente a estas frecuencias. 

b. ¿Qué proporción de estas distancias de ruta son menores 
que 20? ¿Qué proporción de estas rutas tienen distancias 
de recorrido de por lo menos 30? 

c. ¿Aproximadamente cuál es el valor de 90° percentil de 
la distribución de distancia de recorrido de las rutas? 

d. ¿Aproximadamente cuál es la distancia de recorrido de 
ruta mediana? 

Un estudio realizado para investigar la distribución de tiem¬ 
po de frenado total (tiempo de reacción más tiempo de mo¬ 
vimiento de acelerador a freno, en ms) durante condiciones 
de manejo reales a 60 km/h da la siguiente información 
sobre la distribución de los tiempos (“A Field Study on 
Braking Response during Driving”, Ergonomics, 1995: 
1903-1910): 

media = 535 mediana = 500 moda = 500 
Desv. estd. = 96 mínima = 220 máxima = 925 
5 o percentil = 400 10° percentil = 430 

90° percentil = 640 95° percentil = 720 

¿Qué puede concluir sobre la forma de un histograma de es¬ 
tos datos? Explique su razonamiento. 

82 . Los datos muéstrales x v x 2 , ... , x n en ocasiones represen¬ 
tan una serie de tiempo, donde x t = el valor observado de 
una variable de respuesta x en el tiempo t. A menudo la se¬ 
rie observada muestra una gran cantidad de variación alea¬ 
toria, lo que dificulta estudiar el comportamiento a largo 
plazo. En tales situaciones, es deseable producir una ver¬ 
sión alisada de la serie. Una técnica para hacerlo implica el 
alisamiento o atenuación exponencial. Se elige el valor de 
una constante de alisamiento a (0 < a < 1). Luego con x, = 
valor alisado o atenuado en el tiempo t se hace .7 = x l con 
t = 2, 3, . . . , n, x, = ax t + (1 — a)x,_¡. 

a. Considere la siguiente serie de tiempo en la cual x t = 
temperatura (°F) del efluente en una planta de tratamien¬ 
to de aguas negras en el día f. 47, 54, 53, 50, 46, 46, 47, 
50, 51, 50, 46, 52, 50, 50. Trace cada x, contra t en un 
sistema de coordenadas de dos dimensiones (una gráfi¬ 
ca de tiempo-serie). ¿Parece haber algún patrón? 

b. Calcule las x t con a = 0.1. Repita con a = 0.5. ¿Qué 
valor de a da una serie x, más atenuada? 

c. Sustituya x t _ l = otx t _¡ + (1 — a)x t _ 2 en el miembro de 
la derecha de la expresión para x t , acto seguido sustituya 
x,- 2 en función de x,_ 2 , y x,_ 3 , y así sucesivamente. ¿De 
cuántos de los valores x¡, x,_¡, . . . , x¡ depende xp ¿Qué 
le sucede al coeficiente de x t _ k conforme k se incrementa? 

d. Remítase al inciso c). Si t es grande, ¿qué tan sensible es 
x, a la inicialización x¡ = x¡? Explique. 

[Nota: Una referencia pertinente es el artículo “Simple Sta- 
tistics for Interpreting Environmental Data”, Water Pollu- 
tion Control Fed. /., 1981: 167-175.] 

83 . Considere las observaciones numéricas vy, . . . ,x n . Con fre¬ 
cuencia interesa saber si las x¡ están (por lo menos en forma 
aproximada) simétricamente distribuidas en torno al mismo 
valor. Si n es por lo menos grande de manera moderada, el 
grado de simetría puede ser valorado con una gráfica de ta¬ 
llo y hojas o un histograma. Sin embargo, si n no es muy 
grande, las gráficas mencionadas no son informativas en 
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particular. Considere la siguiente alternativa. Que y 1 deno¬ 
te la x¡ más pequeña, y 2 la segunda x¡ más pequeña y así 
sucesivamente. Luego coloque los siguientes pares como 
puntos en una sistema de coordenadas de dos dimensio¬ 
nes (y n - x, x - y¿, (y„_! - x,x - y 2 ), (y n _ 2 - x, 
x — y 3 ),. . . Existen ni 2 puntos cuando n es par y (n - l)/2 
cuando n es impar. 

a. ¿Qué apariencia tiene esta gráfica cuando la simetría en 
los datos es perfecta? ¿Qué apariencia tiene cuando las 
observaciones se alargan más sobre la mediana que de¬ 
bajo de ella (una larga cola superior)? 
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4.1 

7.7 

17.5 

31.4 

32.7 

40.6 

92.4 

115.3 

118.3 

119.0 

129.6 

198.6 

200.7 

242.5 

255.0 

274.7 

274.7 

302.8 

334.1 
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Verzani, John, Using R for Introductory Statistics, Chapman y 
Hall/CRC, Boca Ratón, FL, 2005. Una introducción muy agra¬ 
dable al paquete de “software” R. 



















c2_p046-085.gxd 3/12/08 3:58 AM Page 46 




46 


INTRODUCCIÓN 




e- 


El término probabilidad se refiere al estudio de azar y la incertidumbre en cualquier 
situación en la cual varios posibles sucesos pueden ocurrir; la disciplina de la proba¬ 
bilidad proporciona métodos de cuantificar las oportunidades y probabilidades aso¬ 
ciadas con varios sucesos. El lenguaje de probabilidad se utiliza constantemente de 
manera informal tanto en el contexto escrito como en el hablado. Algunos ejemplos 
incluyen enunciados tales como "es probable que el índice Dow-Jones se incremen¬ 
te al final del año", "existen 50-50 probabilidades de que la persona con posesión 
de su cargo busque la reelección", "probablemente se ofrecerá por lo menos una 
sección del curso el próximo año", "las probabilidades favorecen la rápida solución 
de la huelga" y "se espera que se vendan por lo menos 20 000 boletos para el con¬ 
cierto". En este capítulo, se introducen algunos conceptos de probabilidad, se indica 
cómo pueden ser interpretadas las probabilidades y se demuestra cómo pueden ser 
aplicadas las reglas de probabilidad para calcular las probabilidades de muchos eventos 
interesantes. La metodología de probabilidad permite entonces expresar en lengua¬ 
je preciso enunciados informales como los antes expresados. 

El estudio de la probabilidad como una rama de las matemáticas se remonta a 
más de 300 años, cuando nace en conexión con preguntas que implicaban juegos 
de azar. Muchos libros se han ocupado exclusivamente de la probabilidad, pero el ob¬ 
jetivo en este caso es cubrir sólo la parte de la materia que tiene más aplicación di¬ 
recta en problemas de inferencia estadística. 


O 
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2.1 Espacios muéstrales y eventos 


Un experimento es cualquier acción o proceso cuyo resultado está sujeto a la incertidum¬ 
bre. Aunque la palabra experimento en general sugiere una situación de prueba cuidadosa¬ 
mente controlada en un laboratorio, se le utiliza aquí en un sentido mucho más amplio. Por 
lo tanto, experimentos que pueden ser de interés incluyen lanzar al aire una moneda una vez 
o varias veces, seleccionar una carta o cartas de un mazo, pesar una hogaza de pan, el tiem¬ 
po de recorrido de la casa al trabajo en una mañana particular, obtener tipos de sangre de un 
grupo de individuos o medir las resistencias a la compresión de diferentes vigas de acero. 


El espacio muestral de un experimento 



DEFINICIÓN 


El espacio muestral de un experimento denotado por c?, es el conjunto de todos los 
posibles resultados de dicho experimento. 


Ejemplo 2.1 El experimento más simple al que se aplica la probabilidad es uno con dos posibles resulta¬ 
dos. Tal experimento consiste en examinar un fusible para ver si está defectuoso. El espacio 
muestral de este experimento se abrevia como S = {A, D ¡, donde A representa no defectuo¬ 
so, D representa defectuoso y las llaves se utilizan para encerrar los elementos de un con¬ 
junto. Otro experimento como ése implicaría lanzar al aire una tachuela y observar si cae 
punta arriba o punta abajo, con espacio muestral S = { U, I )} y otro más consistiría en ob¬ 
servar el sexo del siguiente niño nacido en el hospital, con £ = {H, M}. ■ 


Ejemplo 2.2 Si se examinan tres fusibles en secuencia y se anota el resultado de cada examen, entonces un 
resultado del experimento es cualquier secuencia de letras A y D de longitud 3, por lo tanto 

S = {A/VA, AAD, ADA, ADD, DAA, DAD, DDA, DDD} 

Si se hubiera lanzado una tachuela tres veces, el espacio muestral se obtendría reemplazando A 
por U en la expresión S anterior y con un cambio de notación similar se obtendría el espacio 
muestral para el experimento en el cual se observan los sexos de tres niños recién nacidos. ■ 


Ejemplo 2.3 Dos gasolinerías están localizadas en cierta intersección. Cada una dispone de 6 bombas de 
gasolina. Considérese el experimento en el cual se determina el número de bombas en uso 
a una hora particular del día en cada una de las gasolinerías. Un resultado experimental es¬ 
pecifica cuántas bombas están en uso en la primera gasolinería y cuántas están en uso en la 
segunda. Un posible resultado es (2, 2), otro es (4, 1) y otro más es (1, 4). Los 49 resulta¬ 
dos en cf se muestran en la tabla adjunta. El espacio muestral del experimento en el cual un 
dado de 6 lados es lanzado dos veces se obtiene eliminando la fila 0 y la columna 0 de la ta¬ 
bla y se obtienen 36 resultados. 



Segunda gasolinería 




0 

1 

2 

3 

4 

5 

6 


0 

(0, 0) 

(0, 1) 

(0, 2) 

(0, 3) 

(0, 4) 

(0, 5) 

(0, 6) 


1 

(1,0) 

(1, 1) 

(1,2) 

(1, 3) 

(1,4) 

(1,5) 

(1,6) 

Primera 

2 

(2, 0) 

(2, 1) 

(2, 2) 

(2, 3) 

(2, 4) 

(2, 5) 

(2, 6) 

gasolinería 

3 

(3,0) 

(3, 1) 

(3, 2) 

(3, 3) 

(3,4) 

(3,5) 

(3, 6) 


4 

(4, 0) 

(4, 1) 

(4, 2) 

(4, 3) 

(4, 4) 

(4, 5) 

(4, 6) 


5 

(5,0) 

(5, 1) 

(5, 2) 

(5,3) 

(5,4) 

(5,5) 

(5, 6) 


6 

(6, 0) 

(6, 1) 

(6, 2) 

(6, 3) 

(6, 4) 

(6, 5) 

(6, 6) 

























CAPITULO 2 Probabilidad 


Ejemplo 2.4 


DEFINICIÓN 


Ejemplo 2.5 


Ejemplo 2.6 

(continuación 
del ejemplo 
2.3) 


Si el voltaje de una nueva batería tipo D para linterna queda fuera de ciertos límites, dicha 
batería se caracteriza como falla ( F ); si el voltaje de la batería se encuentra dentro de los lí¬ 
mites prescritos, se caracteriza como éxito ( E ). Supóngase un experimento que consiste en 
probar cada batería como sale de la línea de ensamble hasta que se observe primero un éxi¬ 
to. Aunque no es muy probable, un posible resultado de este experimento es que las prime¬ 
ras 10 (o 100 o 1000 o . . .) sean F y la siguiente sea un E. Es decir, para cualquier entero 
positivo n, es posible que se tenga que examinar n baterías antes de encontrar el primer E. 
El espacio muestral es S = { E, FE, FFE, FFFE, . . .}, el cual contiene un número infinito 
de posibles resultados. La misma forma abreviada del espacio muestral es apropiada para un 
experimento en el cual, a partir de una hora especificada, se anota el sexo de cada infante 
recién nacido hasta que nazca un varón. ■ 

Eventos 

En el estudio de la probabilidad, interesan no sólo los resultados individuales de S sino tam¬ 
bién varias recopilaciones de resultados de S. 


Un evento es cualquier recopilación (subconjunto) de resultados contenidos en el es¬ 
pacio muestral S. Un evento es simple si consiste en exactamente un resultado y com¬ 
puesto si consiste en más de un resultado. 


Cuando se realiza un experimento, se dice que ocurre un evento particular A si el resultado 
experimental obtenido está contenido en A. En general, ocurrirá exactamente un evento sim¬ 
ple, pero muchos eventos compuestos ocurrirán al mismo tiempo. 

Considérese un experimento en el cual cada uno de tres vehículos que toman una salida de 
una autopista particular vira a la izquierda (L) o la derecha ( R ) al final de la rampa de sali¬ 
da. Los ocho posibles resultados que constituyen el espacio muestral son LEE, REE, ERE, 
LLR, LRR, RLR, RRL y RRR. Así pues existen ocho eventos simples, entre los cuales están 
E l = { LLL ¡ y E 5 = {LRR}. Algunos eventos compuestos incluyen 

A = { RLL, ERE, EER } = el evento en que exactamente uno de los tres vehículos vire a 
la derecha. 

B = { LEE, RLE, ERL, EER } = el evento en que cuando mucho uno de los vehículos 

vire a la derecha. 

C = {LEE, RRR} = el evento en que los tres vehículos viren en la misma dirección. 

Suponga que cuando se realiza el experimento, el resultado es LEE. Entonces ha ocurrido el 
evento simple £j y por lo tanto también comprende los eventos B y C (pero no A). ■ 

Cuando se observa el número de bombas en uso en cada una de dos gasolinerías de 6 
bombas, existen 49 posibles resultados, por lo que existen 49 eventos simples: E l = ¡(0, 
0)}, E 2 = {(0, 1 E 4g = {(6, 6)}. Ejemplos de eventos compuestos son 

A = {(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} = el evento en que el número de 
bombas en uso es el mismo en ambas gasolinerías. 

B = {(0, 4), (1, 3) (2, 2), (3, 1), (4, 0)} = el evento en que el número total de bombas 
en uso es cuatro. 

C = {(0, 0), (0, 1), (1, 0), (1, 1)} = el evento en que a lo sumo una bomba está en uso 

en cada gasolinería. ■ 



















c2_p046-085.qxd 


3/12/08 3:58 AM Page 49 




Ejemplo 2.7 

(continuación 
del ejemplo 
2.4) 


DEFINICIÓN 


Ejemplo 2.8 

(continuación 
del ejemplo 

2.3) 

Ejemplo 2.9 

(continuación 
del ejemplo 

2.4) 


DEFINICIÓN 


Ejemplo 2.10 


2.1 Espacios muéstrales y eventos 49 

El espacio muestral del experimento del examen de las baterías contiene un número infini¬ 
to de resultados, por lo que existe un número infinito de eventos simples. Los eventos com¬ 
puestos incluyen 

A = {E, FE, FFE } = el evento en que cuando mucho se examinan tres baterías. 

E = {FE, FFFE, FFFFFE,. . .} = el evento en que se examina un número par de 

baterías. ■ 

Algunas relaciones de la teoría de conjuntos 

Un evento es simplemente un conjunto, así que las relaciones y resultados de la teoría ele¬ 
mental de conjuntos pueden ser utilizados para estudiar eventos. Se utilizarán las siguientes 
operaciones para crear eventos nuevos a partir de eventos dados. 


1. El complemento de un evento A, denotado por A', es el conjunto de todos los re¬ 
sultados en c?que no están contenidos en A. 

2. La unión de dos eventos Ay B, denotados por AUBy leídos “A o B”, es el even¬ 
to que consiste en todos los resultados que están en A o en B o en ambos eventos 
(de tal suerte que la unión incluya resultados donde tanto A como B ocurren, así 
también resultados donde ocurre exactamente uno), es decir, todos los resultados 
en por lo menos uno de los eventos. 

3. La intersección de dos eventos Ay B, denotada por AHÍ y leída “A y B", es el 
evento que consiste en todos los resultados que están tanto en A como en B. 


En el experimento en el cual se observa el número de bombas en uso en una sola gasoline- 
ría de seis bombas, sea A = {0, 1, 2, 3, 4}, B = {3, 4, 5, 6} y C = { 1, 3, 5¡. Entonces 

A'= {5,6}, AUfi = {0, 1, 2, 3, 4, 5, 6} = S, A U C = {0, 1, 2, 3, 4, 5}, 

A (~) B = {3, 4}, ADC={1, 3}, (A n Q'= {0, 2, 4, 5, 6} ■ 

En el experimento de la batería, defina A, B y C como 

A = {E, FE, FFE], B = {E, FFE, FFFFE }, C = [FE, FFFE, FFFFFE, . . .} 
Entonces 

A' = {FFFE, FFFFE, FFFFFE, . . .}, C' = {E, FFE, FFFFE, . . .} 

A U B = {E, FE, FFE, FFFFE), A D B = {E, FFE) ■ 

En ocasiones AyBno tienen resultados en común, por lo que la intersección de A y 
B no contiene resultados. 


Que 0 denote el evento nulo (el evento sin resultados). Cuando A n B = 0, se dice 

que Ay B son eventos mutuamente excluyentes o disjuntos. 


En una pequeña ciudad hay tres distribuidores de automóviles: un distribuidor GM que ven¬ 
de Chevrolets, Pontiacs y Buicks; un distribuidor Ford que vende Fords y Mercurys; y un 
distribuidor Chrysler que vende Plymouths y Chryslers. Si un experimento consiste en ob¬ 
servar la marca del siguiente carro vendido, entonces los eventos A = {Chevrolet, Pontiac, 
Buick} y B = {Ford, Mercury} son mutuamente excluyentes porque el siguiente carro ven¬ 
dido no puede ser tanto un producto GM como un producto Ford. ■ 
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CAPITULO 2 


Probabilidad 


Las operaciones de unión e intersección pueden ser ampliadas a más de dos eventos. Para 
tres eventos cualesquiera A, B y C, el evento A U B U C es el conjunto de resultados contenidos 
en por lo menos uno de los tres eventos, mientras que A fl B D C es el conjunto de resulta¬ 
dos contenidos en los tres eventos. Se dice que los eventos dados A¡, A 2 , A 3 ,..., son mutuamen¬ 
te excluyentes (disjuntos por pares) si ninguno de dos eventos tienen resultados en común. 

Con diagramas de Venn se obtiene una representación pictórica de eventos y manipula¬ 
ciones con eventos. Para construir un diagrama de Venn, se traza un rectángulo cuyo interior 
representará el espacio muestral S. En tal caso cualquier evento A se representa como el inte¬ 
rior de una curva cerrada (a menudo un círculo) contenido en S. La figura 2.1 muestra ejem¬ 
plos de diagramas de Venn. 


A GD 8 

s 

A GD 8 

s 

A GD 8 

s 

© 

s 

A o O” 

s 


a) Diagrama de Venn b) La región sombreada c) La región sombreada d) La región sombreada e) Eventos mutuamente 
de los eventos Ay B esA fl 5 es A U # es A' excluyentes 


Figura 2.1 Diagramas de Venn. 

EJERCICIOS Sección 2.1 (1-10) 


1. Cuatro universidades, 1, 2, 3 y 4, están participando en un 
torneo de básquetbol. En la primera ronda, 1 jugará con 2 y 
3 jugará con 4. Acto seguido los ganadores jugarán por el 
campeonato y los dos perdedores también jugarán. Un po¬ 
sible resultado puede ser denotado por 1324 (1 derrota a 2 
y 3 derrota a 4 en los juegos de la primera ronda y luego 1 
derrota a 3 y 2 derrota a 4). 

a. Enumere todos los resultados en S. 

b. Que A denote el evento en que 1 gana el torneo. Enume¬ 
re los resultados en A. 

c. Que B denote el evento en que 2 gana el juego de cam¬ 
peonato. Enumere los resultados en B. 

d. ¿Cuáles son los resultados en A U B y en A ÍT fi? ¿Cuá¬ 
les son los resultados en A'? 

2. Suponga que un vehículo que toma una salida particular de 
una autopista puede virar a la derecha (R), virar a la izquier¬ 
da (L) o continuar de frente ( S ). Observe la dirección de cada 
uno de tres vehículos sucesivos. 

a. Elabore una lista de todos los resultados en el evento A 
en que los tres vehículos van en la misma dirección. 

b. Elabore una lista de todos los resultados en el evento B 
en que los tres vehículos toman direcciones diferentes. 

c. Elabore una lista de todos los resultados en el evento C 
en que exactamente dos de los tres vehículos dan vuelta 
a la derecha. 

d. Elabore una lista de todos los resultados en el evento D 
en que dos vehículos van en la misma dirección. 

e. Enumere los resultados en £>', C U D y C fl D. 

3 . Tres componentes están conectados para formar un sistema 
como se muestra en el diagrama adjunto. Como los compo¬ 
nentes del subsistema 2-3 están conectados en paralelo, di¬ 
cho subsistema funcionará si por lo menos uno de los dos 
componentes individuales funciona. Para que todo el siste¬ 
ma funcione, el componente 1 debe funcionar y por lo tan¬ 
to el subsistema 2-3 debe hacerlo. 



El experimento consiste en determinar la condición de cada 
componente [E (éxito) para un componente que funciona y 
F (falla) para un componente que no funciona], 

a. ¿Qué resultados están contenidos en el evento A en que 
exactamente dos de los tres componentes funcionan? 

b. ¿Qué resultados están contenidos en el evento B en 
que por lo menos dos de los componentes funcionan? 

c. ¿Qué resultados están contenidos en el evento C en que 
el sistema funciona? 

d. Ponga en lista los resultados en C',A U C,A (1 C,SU 
C y B fl C. 

4 . Cada muestra de cuatro hipotecas residenciales está clasi¬ 
ficada como tasa fija (F) o tasa variable (P). 

a. ¿Cuáles son los 16 resultados en T? 

b. ¿Qué resultados están en el evento en que exactamente 
tres de las hipotecas seleccionadas son de tasa fija? 

c. ¿Qué resultados están en el evento en que las cuatro hi¬ 
potecas son del mismo tipo? 

d. ¿Qué resultados están en el evento en que a lo sumo una 
de las cuatro es una hipoteca de tasa variable? 

e. ¿Cuál es la unión de eventos en los incisos c) y d) y cuál 
es la intersección de estos dos eventos? 

f. ¿Cuáles son la unión e intersección de los dos eventos en 
los incisos b) y c)? 

5. Una familia compuesta de tres personas. A, B y C, pertene¬ 
ce a una clínica médica que siempre tiene disponible un 
doctor en cada una de las estaciones 1, 2 y 3. Durante cier¬ 
ta semana, cada miembro de la familia visita la clínica una 
vez y es asignado al azar a una estación. El experimento 
consiste en registrar la estación para cada miembro. Un 
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resultado es (1, 2, 1) para A a la estación 1, B a la estación 
2 y C a la estación 1. 

a. Elabore una lista de los 27 resultados en el espacio 
muestral. 

b. Elabore una lista de todos los resultados en el evento en 
que los tres miembros van a la misma estación. 

c. Elabore una lista de todos los resultados en que los tres 
miembros van a diferentes estaciones. 

d. Elabore una lista de los resultados en el evento en que 
ninguno va a la estación 2. 

6 . La biblioteca de una universidad dispone de cinco ejempla¬ 
res de un cierto texto en reserva. Dos ejemplares (1 y 2) 
son primeras impresiones y los otros tres (3, 4 y 5) son se¬ 
gundas impresiones. Un estudiante examina estos libros en 
orden aleatorio, y se detiene sólo cuando una segunda im¬ 
presión ha sido seleccionada. Un posible resultado es 5 y 
otro 213. 

a. Ponga en lista los resultados en S. 

b. Que A denote el evento en que exactamente un libro de¬ 
be ser examinado. ¿Qué resultados están en A? 

c. Sea B el evento en que el libro 5 es seleccionado. ¿Qué 
resultados están en 5? 

d. Sea C el evento en que el libro 1 no es examinado. ¿Qué 
resultados están en C? 

7 . Un departamento académico acaba de votar secretamente 
para elegir un jefe de departamento. La urna contiene cua¬ 
tro boletas con votos para el candidato A y tres con votos 
para el candidato B. Suponga que estas boletas se sacan de 
la urna una por una. 

a. Ponga en lista todos los posibles resultados. 

b. Suponga que mantiene un conteo continuo de la boletas 
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retiradas de la urna. ¿Para qué resultados A se mantiene 
adelante durante todo el conteo? 

8. Una firma constructora de ingeniería en la actualidad está tra¬ 
bajando en plantas eléctricas en tres sitios diferentes. Que A 
denote el evento en que la planta localizada en el sitio i se com¬ 
pleta alrededor de la fecha contratada. Use las operaciones de 
unión, intersección y complemento para describir cada uno 
de los siguientes eventos en función de A¡, A 2 y A 3 , trace un 
diagrama y sombree la región que corresponde a cada uno. 

a. Por lo menos una planta se completa alrededor de la fe¬ 
cha contratada. 

b. Todas las plantas se completan alrededor de la fecha 
contratada. 

c. Sólo la planta localizada en el sitio 1 se completa alre¬ 
dedor de la fecha contratada. 

d. Exactamente una planta se completa alrededor de la fe¬ 
cha contratada. 

e. O la planta localizada en el sitio 1 o las otras dos plan¬ 
tas se completan alrededor de la fecha contratada. 

9. Use diagramas de Venn para las dos siguientes relaciones 
para los eventos A y B (éstas se conocen como leyes De 
Morgan): 

a. (A U B)' = A' n B' 

b. (A O B)' = A' U fi' 

10. a. En el ejemplo 2.10, identifique tres eventos que son mu¬ 
tuamente excluyentes. 

b. Suponga que no hay ningún resultado común a los tres 
eventos A, B y C. ¿Son estos tres eventos necesariamen¬ 
te mutuamente excluyentes? Si su respuesta es sí, expli¬ 
que por qué; si su respuesta es no, dé un contraejemplo 
valiéndose del experimento del ejemplo 2.10. 


2.2 Axiomas, interpretaciones y 
propiedades de probabilidad 

Dados un experimento y un espacio muestral S, el objetivo de la probabilidad es asignar a 
cada evento A un número P(A), llamado la probabilidad del evento A, el cual dará una me¬ 
dida precisa de la oportunidad de que A ocurra. Para garantizar que las asignaciones serán 
consistentes con las nociones intuitivas de la probabilidad, todas las asignaciones deberán sa¬ 
tisfacer los siguientes axiomas (propiedades básicas) de probabilidad. 


AXIOMA 1 
AXIOMA 2 
AXIOMA 3 


Para cualquier evento A, P(A) > 0. 

P( S) = 1. 

Si Aj, A 2 , A 3 , ... es un conjunto de eventos mutuamente excluyentes, entonces 

00 

P(A l U A 2 U A 3 U • • •) = E P(A¡) 

i= 1 


Se podría preguntar por qué el tercer axioma no contiene ninguna referencia a un con¬ 
junto finito de eventos mutuamente excluyentes. Es porque la propiedad correspondiente para 
un conjunto finito puede ser derivada de los tres axiomas. Se pretende que la lista de axio¬ 
mas sea tan corta como sea posible y que no contenga alguna propiedad que pueda ser de¬ 
rivada de los demás que aparecen en la lista. El axioma 1 refleja la noción intuitiva de que la 
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probabilidad de que ocurra A deberá ser no negativa. El espacio muestral es por definición el 
evento que debe ocurrir cuando se realiza el experimento (S contiene todos los posibles re¬ 
sultados), así se dice el axioma 2 que es la máxima probabilidad posible de 1 está asignada 
a c?. El tercer axioma formaliza la idea que si se desea la probabilidad de que ocurra al me¬ 
nos uno de varios eventos, y no ocurran dos al mismo tiempo, entonces la probabilidad de 
que por lo menos uno ocurra es la suma de las probabilidades de los eventos individuales. 



PROPOSICIÓN 


P(0) = 0 donde 0 es el evento nulo (el evento que no contiene resultados en abso¬ 
luto). Esto a su vez implica que la propiedad contenida en el axioma 3 es válida para 
un conjunto finito de eventos. 


Comprobación Primero considérese el conjunto infinito A¡ = 0, A 2 = 0, A 3 = 0,.... 
Como 0 ÍT 0 = 0, los eventos en este conjunto son disjuntos y U A¡ = 0. El tercer axioma 
da entonces 

P(0) = 2 P(0) 

Esto puede suceder sólo si P(0) = 0. 

Ahora supóngase que A v A 2 ,. . ., A k son eventos disjuntos y anéxense a éstos el con¬ 
junto finito A k+ j = 0, A k+2 = 0, A k+3 = 0, .... De nuevo si se invoca el tercer axioma. 

/ k \ / oo \ 00 k 

P UA,- = P U A¡ = 2p(A,.) = 2>(A,) 

Vf =i / Vi=i / ;=i i=i 

como se deseaba. ■ 


Ejemplo 2.11 Considere lanzar una tachuela al aire. Cuando se detiene en el suelo, o su punta estará ha¬ 
cia arriba (el resultado U) o hacia abajo (el resultado D). El espacio muestral de este even¬ 
to es por consiguiente S = { U. I) j. Los axiomas especifican P(S) = 1, por lo que la 
asignación de probabilidad se completará determinando P(U) y P(D). Como U y D están 
desarticulados y su unión S. la siguiente proposición implica que 

1 = P{S) = P(U) + P(D) 

Se desprende que P(D) = 1 — P(U). Una posible asignación de probabilidades es P(U) = 
0.5, P(D) = 0.5, mientras que otra posible asignación es P(U) = 0.75, P(D ) = 0.25. De 
hecho, si p representa cualquier número fijo entre 0 y 1, PiU) = p, P(D) = 1 — p es una 
asignación compatible con los axiomas. ■ 

Ejemplo 2.12 Regresemos al experimento del ejemplo 2.4, en el cual se prueban las baterías que salen de la 
línea de ensamble una por una hasta que se encuentra una con el voltaje dentro de los límites 
prescritos. Los eventos simples son £j = {£}, E 2 = {FE}, E 3 = {FFE}, E A = [FFFE], 
Suponga que la probabilidad de que cualquier batería resulte satisfactoria es de 0.99. Entonces 
se puede demostrar que P(F¡) = 0.99, P(F 2 ) = (0.01)(0.99), P(F } ) = (0.01) 2 (0.99),... es una 
asignación de probabilidades a los eventos simples que satisface los axiomas. En particular, co¬ 
mo los E¡ son disjuntos y S = £j U E 2 U E 3 U .. ., debe ser el caso de que 

1 = P(S) = píe,) + P(E 2 ) + P(E 3 ) + ■■■ 

= 0.99[1 + 0.01 + (0.01) 2 + (0.01 ) 3 + • ■ ■] 

Aquí se utilizó la fórmula para la suma de una serie geométrica: 

a + ar + ar 2 + ar 3 + ■ • • = - 

1 — r 
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Sin embargo, otra asignación de probabilidad legítima (de acuerdo con los axiomas) 
del mismo tipo “geométrico” se obtiene reemplazando 0.99 por cualquier otro número p en¬ 
tre 0 y 1 (y 0.01 por 1 — p). ■ 

Interpretación de probabilidad 

Los ejemplos 2.11 y 2.12 muestran que los axiomas no determinan por completo una asig¬ 
nación de probabilidades a eventos. Los axiomas sirven sólo para excluir las asignaciones 
incompatibles con las nociones intuitivas de probabilidad. En el experimento de lanzar al ai¬ 
re tachuelas del ejemplo 2.11, se sugirieron dos asignaciones particulares. La asignación apro¬ 
piada o correcta depende de la naturaleza de la tachuela y también de la interpretación de 
probabilidad. La interpretación que más frecuentemente se utiliza y más fácil de entender 
está basada en la noción de frecuencias relativas. 

Considérese un experimento que pueda ser realizado repetidamente de una manera 
idéntica e independiente y sea A un evento que consiste en un conjunto fijo de resultados 
del experimento. Ejemplos simples de experimentos repetibles incluyen el lanzamiento al 
aire de tachuelas y dados previamente discutidos. Si el experimento se realiza n veces, en 
algunas de las réplicas el evento A ocurrirá (el resultado estará en el conjunto A) y en otros, 
A no ocurrirá. Que n{A ) denote el número de réplicas en las cuales A sí ocurre. Entonces la 
relación n(A)/n se conoce como Xa frecuencia relativa de ocurrencia del evento A en la se¬ 
cuencia de n réplicas. La evidencia empírica basada en los resultados de muchas de estas 
secuencias de experimentos repetibles, indica que a medida que n se hace más grande, la 
frecuencia relativa n(A)/n se estabiliza, como se ilustra en la figura 2.2. Es decir, conforme 
n se hace arbitrariamente grande, la frecuencia relativa tiende a un valor límite al que se ha¬ 
ce referencia como frecuencia relativa límite del evento A. La interpretación objetiva de pro¬ 
babilidad identifica esta frecuencia relativa límite con P(A). 
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Figura 2.2 Estabilización de la frecuencia relativa. 


Si se asignan probabilidades a eventos de acuerdo con sus frecuencias relativas límite, 
entonces se puede interpretar una aseveración tal como “la probabilidad de que una mone¬ 
da que cae con el águila hacia arriba cuando es lanzada al aire es 0.5” para dar a entender 
que en un gran número de los lanzamientos, aparecerá un águila en aproximadamente la mi¬ 
tad de los lanzamientos y un sol en la otra mitad. 

Se dice que esta interpretación de frecuencia relativa de probabilidad es objetiva por¬ 
que se apoya en una propiedad del experimento y no en cualquier individuo particular inte¬ 
resado en el experimento. Por ejemplo, dos observadores diferentes de una secuencia de 
lanzamiento de una moneda deberán utilizar la misma asignación de probabilidad puesto que 
los observadores no tienen nada que ver con la frecuencia relativa límite. En la práctica, 
la interpretación no es tan objetiva como pudiera parecer, puesto que la frecuencia relativa 
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límite de un evento no será conocida. Por tanto, se tendrán que asignar probabilidades con ba¬ 
se en creencias sobre la frecuencia relativa límite de eventos en estudio. Afortunadamente, 
existen muchos experimentos para los cuales habrá consenso con respecto a asignaciones de 
probabilidad. Cuando se habla de una moneda imparcial, significa P(H) = P(T) = 0.5 y un 
dado imparcial es uno para el cual las frecuencias relativas límite de los seis resultados son 
1/6, lo que sugiere las asignaciones de probabilidad P( [ 1 }) = •■• = P( {6}) = 1/6. 

Como la interpretación objetiva de probabilidad está basada en la noción de frecuen¬ 
cia límite, su aplicabilidad está restringida a situaciones experimentales repetibles. No obs¬ 
tante, el lenguaje de probabilidad a menudo se utiliza en conexión con situaciones que son 
inherentemente irrepetibles. Algunos ejemplos incluyen: “las probabilidades de un tratado 
de paz son buenas”; “es probable que el contrato le será otorgado a nuestra compañía”; y 
“como su mejor mariscal de campo está lesionado, espero que no anoten más de 10 puntos 
contra nosotros”. En tales situaciones se desearía, como antes, asignar probabilidades nu¬ 
méricas a varios resultados y eventos (p. ej., la probabilidad es 0.9 de que obtendremos el 
contrato). Por consiguiente se debe adoptar una interpretación alternativa de estas probabi¬ 
lidades. Como diferentes observadores pueden tener información y opiniones previas con 
respecto a tales situaciones experimentales, las asignaciones de probabilidad ahora pueden 
definir de un individuo a otro. Las interpretaciones en tales situaciones se conocen por lo 
tanto como subjetivas. El libro de Robert Winkler citado en las referencias del capítulo da 
un recuento muy fácil de leer de varias interpretaciones subjetivas. 


PROPOSICIÓN 


Más propiedades de probabilidad 


Para cualquier evento A, P(A) + P(A') = 1, a partir de la cual P(A) = 1 - P(A'). 


Comprobación En el axioma 3, sea k = 2, A t = A y A 2 = A' . Como por definición 
de A', A U A' = S en tanto A y A' sean eventos disjuntos, 1 = P( S) = P(A U A') = 

pía) + p(a'). m 

Esta proposición es sorprendentemente útil porque se presentan muchas situaciones 
en las cuales P{A') es más fácil de obtener mediante métodos directos que P(A). 

Ejemplo 2.13 Considere un sistema de cinco componentes idénticos conectados en serie, como se ilustra 
en la figura 2.3. 




Figura 2.3 Un sistema de cinco componentes conectados en serie. 

Denote un componente que falla por F y uno que no lo hace por E (éxito). Sea A el evento 
en que el sistema falla. Para que ocurra A, por lo menos uno de los componentes individuales 
debe fallar. Los resultados en A incluyen EEFEE( 1, 2, 4 y 5 funcionarán, pero 3 no). FFEEE, 
y así sucesivamente. Existen de hecho 31 resultados diferentes en A. Sin embargo, A', el 
evento en que el sistema funciona, consiste en el resultado único EEEEE. En la sección 2.5 
se verá que si 90% de todos estos componentes no fallan y diferentes componentes lo hacen 
independientemente uno de otro, entonces P(A') = P{EEEEE) = 0.9 5 = 0.59. Así pues P(A) 
= 1 — 0.59 = 0.41; por lo tanto, entre un gran número de sistemas como ése, aproximada¬ 
mente 41% fallarán. ■ 

En general, la proposición anterior es útil cuando el evento de interés puede ser 
expresado “por lo menos ...” puesto que en ese caso puede ser más fácil trabajar con el 
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PROPOSICIÓN 


PROPOSICIÓN 
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Ejemplo 2.14 
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complemento “menos que . . (en algunos problemas es más fácil trabajar con “más 
que. . .” que con “cuando . . .”). Cuando se tenga dificultad al calcular P(A ) directamente, 
habrá que pensar en determinar P(A'). 


Para cualquier evento A, P(A) < 1 . 


Esto se debe a que 1 = P(A) + P(A ’) > P(A) puesto que P(A') > 0. 

Cuando los eventos Ay B son mutuamente excluyentes, PÍA U B) = P{A) + P{B). 
Para eventos que no son mutuamente excluyentes, la adición de P(A ) y P(B) da por resul¬ 
tado un “doble conteo” de los resultados en la intersección. El siguiente resultado muestra 
cómo corregir esto. 


Para dos eventos cualesquiera Ay B. 

P(A U B) = P(A) + P(B) - P(A n B) 


Comprobación Obsérvese primero que A U B puede ser descompuesto en dos eventos 
excluyentes, A y B Cl A'; la última es la parte B que queda afuera de A. Además, B por sí 
mismo es la unión de los dos eventos excluyentes A Cl B y A' Cl B, por lo tanto P(B) = 
P(A Cl B) + P(A' Cl B). Por lo tanto 



P(A U B) = P(A) + P(B Cl A') = PÍA) + [P(5) - P(A Cl 5)] 

= P(A) + P(B) - P(A Cl B) 


A GD' 

= 

CD 

u 

GD 


Figura 2.4 Representación de A U B como una unión de eventos excluyentes. ■ 

En cierto suburbio residencial, 60% de las familias se suscriben al periódico en una ciudad 
cercana, 80% lo hacen al periódico local y 50% de todas las familias a ambos periódicos. Si 
se elige una familia al azar, ¿cuál es la probabilidad de que se suscriba a (1) por lo menos a 
uno de los dos periódicos y (2) exactamente a uno de los dos periódicos? 

Con A = {se suscribe al periódico metropolitano} y B = {se suscribe al periódico lo¬ 
cal}, la información dada implica que P(A) = 0.6, Pili) = 0.8 y P(A D B) = 0.5. La pro¬ 
posición precedente ahora lleva a 

P( se suscribe a por lo menos uno de los dos periódicos) 

= P(A U B) = P(A) + P(B) - P(A n B) = 0.6 + 0.8 - 0.5 = 0.9 

El evento en que una familia se suscribe a sólo el periódico local se escribe como A' Cl B 
[(no metropolitano) y local]. Ahora la figura 2.4 implica que 

0.9 = P(A U B) = P(A) + P(A’ f)B) = 0.6 + P(A' Cl B ) 

a partir de la cual P(A' Cl B) = 0.3. Asimismo P(A Cl B') = P(A U E) — P(B ) = 0.1. Todo 
esto se ilustra en la figura 2.5, donde se ve que 


^(exactamente uno) = P(A D B') + P(A' Cl B) = 0.1 + 0.3 = 0.4 
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Figura 2.5 Probabilidades para el ejemplo 2.14. ■ 

La probabilidad de una unión de más de dos eventos se calcula en forma análoga. 


Para tres eventos cualesquiera A, B y C, 

P(A U B U C) = P(A) + P(B ) + P(C) - PÍA fifi) - P(A n C) 
- p(b n C) + pía n b n o 


Esto se puede ver examinando un diagrama de Venn de A U B U C, el cual se muestra en 
la figura 2.6. Cuando P(A), P{B ) y P(C) se agregan, ciertas intersecciones se cuentan dos 
veces, por lo que deben ser restadas, pero esto hace que P{A P\ B P\ C) se reste una vez en 
exceso. 



Figura 2.6 A(J BU C. 

Determinación de probabilidades sistemáticamente 

Considérese un espacio muestral que es o finito o “contablemente infinito” (lo segundo sig¬ 
nifica que los resultados pueden ser puestos en lista en una secuencia infinita, por lo que 
existe un primer resultado, un segundo, un tercero, y así sucesivamente, por ejemplo, el es¬ 
cenario de prueba de baterías del ejemplo 2.4). Que £j, E 2 , E 3 ,. . . denoten los eventos sim¬ 
ples correspondientes, cada uno compuesto de un solo resultado. Una estrategia sensible para 
el cálculo de probabilidad es determinar primero cada probabilidad de evento simple, con el 
requerimiento de que P{E¡) = 1. Entonces la probabilidad de cualquier evento compuesto 
A se calcula agregando los P(E¡) para todos los E¡ que existen en A: 

P(A) = 2 PÍE) 

todos los E¡ en A 

Ejemplo 2.15 Durante las horas no pico el tren que viaja entre los suburbios y la ciudad utiliza cinco carros. 

Suponga que existe el doble de probabilidades de que un usuario seleccione el carro interme¬ 
dio (#3) que cualquier carro adyacente (#2 o #4) y el doble de probabilidades de que seleccio¬ 
ne cualquier carro adyacente que cualquier carro extremo (#1 o #5). Sea p¡ = P(carro i 
seleccionado) = P(E¡). Entonces se tiene p 3 = 2/?, = 2p 4 y p 2 = 2/>, = 2 p 5 = p 4 . Esto da 

1 = 5>(£j) = Pi + 2 p 1 + 4 / 7 , + 2 />, + Pi = 10 / 7 , 

es decir, />, = p 5 = 0.1, p 2 = p 4 = 0.2, p 3 = 0.4. La probabilidad de que uno de los tres ca¬ 
rros intermedios se seleccione (un evento compuesto) es entonces p 2 + p 3 + p A = 0.8. 
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Resultados igualmente probables 

En muchos experimentos compuestos de N resultados, es razonable asignar probabilidades 
iguales a los N eventos simples. Éstos incluyen ejemplos tan obvios como lanzar al aire una 
moneda o un dado imparciales una o dos veces (o cualquier número fijo de veces) o selec¬ 
cionar una o varias cartas de un mazo bien barajado de 52 cartas. Con p = P(E¡) por cada i, 
N N j 

1 = X P(E¡) = Lp=p-N por lo tanto p = — 

1=1 1=1 N 

Es decir, si existen N resultados igualmente probables, la probabilidad de cada uno es I//V. 

Ahora considérese un evento A, con N(A ) como el número de resultados contenidos 
en A. Entonces 


P(A) = 2 P(E¡) = 1 l 

E¿ en A E¡ en A 1 


N(A) 

N 


Por lo tanto, cuando los resultados son igualmente probables, el cálculo de probabili¬ 
dades se reduce a contar: determinar tanto el número de resultados N(A) en A como el nú¬ 
mero de resultados N en S y formar su relación. 


Ejemplo 2.16 Cuando dos dados se lanzan por separado, existen N = 36 resultados (elimine la primera 
fila y la primera columna de la tabla del ejemplo 2.3). Si ambos dados son imparciales, los 
36 resultados son igualmente probables, por lo tanto P(E¡) = Entonces el evento A = 
{suma de dos números = 7} consta de seis resultados (1, 6), (2, 5), (3, 4), (4, 3), (5, 2) y 
(6, 1), por lo tanto 


P(A) 


N(A) 

N 



EJERCICIOS Sección 2.2 (11-28) 


11. Una compañía de fondos de inversión mutua ofrece a sus 
clientes varios fondos diferentes: un fondo de mercado de 
dinero, tres fondos de bonos (a corto, intermedio y a largo 
plazos), dos fondos de acciones (de moderado y alto riesgo) 
y un fondo balanceado. Entre los clientes que poseen accio¬ 
nes en un solo fondo, los porcentajes de clientes en los di¬ 
ferentes fondos son como sigue: 


Mercado de dinero 20% 
Bonos a corto plazo 15% 
Bonos a plazo 

intermedio 10% 

Bonos a largo plazo 5% 


Acciones de alto riesgo 18% 
Acciones de riesgo 

moderado 25% 

Balanceadas 7% 


Se selecciona al azar un cliente que posee acciones en sólo 

un fondo. 

a. ¿Cuál es la probabilidad de que el individuo selecciona¬ 
do posea acciones en el fondo balanceado? 

b. ¿Cuál es la probabilidad de que el individuo posea ac¬ 
ciones en un fondo de bonos? 

c. ¿Cuál es la probabilidad de que el individuo selecciona¬ 
do no posea acciones en un fondo de acciones? 


12. Considere seleccionar al azar un estudiante en cierta univer¬ 
sidad y que A denote el evento en que el individuo seleccio¬ 


nado tenga una tarjeta de crédito Visa y que B sea el evento 
análogo para la tarjeta MasterCard. Suponga que P{A) = 
0.5, P(B) = 0.4 y P(A ílí) = 0.25. 

a. Calcule la probabilidad de que el individuo seleccionado 
tenga por lo menos uno de los dos tipos de tarjetas (es de¬ 
cir, la probabilidad del evento A U B). 

b. ¿Cuál es la probabilidad de que el individuo seleccionado 
no tenga ningún tipo de tarjeta? 

c. Describa, en función de A y B, el evento de que el estudian¬ 
te seleccionado tenga una tarjeta Visa pero no una Master¬ 
Card y luego calcule la probabilidad de este evento. 

13. Una firma consultora de computación presentó propuestas en 
tres proyectos. Sea A,. = {proyecto otorgado i], con i = 1, 2, 
3 y suponga que P(A l ) = 0.22, P(A~) = 0.25, P(A¡) = 0.28, 

P(A l n a 2 ) = o.n, P(A 1 n a 3 ) = o. 05 , p(a 2 n a 3 ) = 0.07, 

P(A l HAjíl A 3 ) = 0.01. Exprese en palabras cada uno de 
los siguientes eventos y calcule la probabilidad de cada uno: 

a. Aj U A 2 

b. A[ Cl A 2 [ Sugerencia: (Aj U A 2 )' = A\ Cl A 2 ] 

c. AjUA 2 ua 3 d. a; n a 2 n a¡ 

e. AJflAjn A 3 f. (A;nAi)UA 3 

14. Una compañía de electricidad ofrece una tarifa de consumo 
mínimo a cualquier usuario cuyo consumo de electricidad 
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sea de menos de 240 kWh durante un mes particular. Si A 
denota el evento en que un usuario seleccionado al azar en 
una cierta comunidad no excede el consumo mínimo duran¬ 
te enero y B el evento análogo para el mes de julio (Ay B 
se refieren al mismo usuario. Suponga P(A) = 0.8, P(B) = 
0.7 y P(A U B) = 0.9. Calcule lo siguiente: 

a. P(A n B). 

b. La probabilidad de que el consumo mínimo sea sobrepa¬ 
sado en exactamente uno de los dos meses. Describa es¬ 
te evento en función de Ay B. 

15. Considere el tipo de secadora de ropa (de gas o eléctrica) 
adquirida por cada uno de cinco clientes diferentes en cier¬ 
ta tienda. 

a. Si la probabilidad de que a lo sumo uno de éstos adquiera 
una secadora eléctrica es 0.428, ¿cuál es la probabilidad de 
que por lo menos dos adquieran una secadora eléctrica? 

b. Si P( los cinco compran una secadora de gas) = 0.116 y 
P(los cinco compran una secadora eléctrica) = 0.005, 
¿cuál es la probabilidad de que por lo menos se adquie¬ 
ra una secadora de cada tipo? 

16. A un individuo se le presentan tres vasos diferentes de refres¬ 
co de cola, designados C,DyP. Se le pide que pmebe los tres 
y que los ponga en lista en orden de preferencia. Suponga que 
se sirvió el mismo refresco de cola en los tres vasos. 

a. ¿Cuáles son los eventos simples en este evento de clasi¬ 
ficación y qué probabilidad le asignaría a cada uno? 

b. ¿Cuál es la probabilidad de que C obtenga el primer lugar? 

c. ¿Cuál es la probabilidad de que C obtenga el primer lu¬ 
gar y D el último? 

17. Que A denote el evento en que la siguiente solicitud de ase¬ 
soría de un consultor de “software” estadístico tenga que 
ver con el paquete SPSS y que B denote el evento en que la 
siguiente solicitud de ayuda tiene que ver con SAS. Supon¬ 
ga que P(A ) = 0.30 y P(B) = 0.50. 

a. ¿Por qué no es el caso en que P(A) + P(B) =1? 

b. Calcule P(A'). 

c. Calcule P(A U B). 

d. Calcule P(A' CI B'). 

18. Una caja contiene cuatro focos de 40 W, cinco de 60 W y 
seis de 75 W. Si los focos se eligen uno por uno en orden 
aleatorio, ¿cuál es la probabilidad de que por lo menos dos 
focos deban ser seleccionados para obtener uno de 75 W? 

19. La inspección visual humana de uniones soldadas en un 
circuito impreso puede ser muy subjetiva. Una parte del 
problema se deriva de los numerosos tipos de defectos de 
soldadura (p. ej., almohadilla seca, visibilidad en escuadra, 
picaduras) e incluso el grado al cual una unión posee uno 
o más de estos defectos. Por consiguiente, incluso inspec¬ 
tores altamente entrenados pueden discrepar en cuanto a la 
disposición particular de una unión particular. En un lote 
de 10 000 uniones, el inspector A encontró 724 defectuo¬ 
sas, el inspector B, 751 y 1159 de las uniones fueron con¬ 
sideradas defectuosas por cuando menos uno de los 
inspectores. Suponga que se selecciona una de las 10 000 
uniones al azar. 

a. ¿Cuál es la probabilidad de que la unión seleccionada no 
sea juzgada defectuosa por ninguno de los dos inspectores? 


b. ¿Cuál es la probabilidad de que la unión seleccionada 
sea juzgada defectuosa por el inspector B pero no por 
inspector A? 

20. Cierta fábrica utiliza tres tumos diferentes. Durante el año 
pasado, ocurrieron 200 accidentes en la fábrica. Algunos de 
ellos pueden ser atribuidos por lo menos en parte a condi¬ 
ciones de trabajo inseguras. La tabla adjunta da el porcen¬ 
taje de accidentes que ocurren en cada tipo de categoría de 
accidente-tumo. 

Condiciones No relacionados 



inseguras 

a condiciones 

Día 

10% 

35% 

Turno Tarde 

8% 

20% 

Noche 

5% 

22% 


Suponga que uno de los 200 reportes de accidente se selec¬ 
ciona al azar de un archivo de reportes y que el tumo y el ti¬ 
po de accidente se determinan. 

a. ¿Cuáles son los eventos simples? 

b. ¿Cuál es la probabilidad de que el accidente selecciona¬ 
do se atribuya a condiciones inseguras? 

c. ¿Cuál es la probabilidad de que el accidente selecciona¬ 
do no ocurrió en el tumo de día. 

21. Una compañía de seguros ofrece cuatro diferentes niveles 
de deducible, ninguno, bajo, medio y alto, para sus tenedo¬ 
res de pólizas de propietario de casa y tres diferentes nive¬ 
les, bajo, medio y alto, para sus tenedores de pólizas de 
automóviles. La tabla adjunta da proporciones de las varias 
categorías de tenedores de pólizas que tienen ambos tipos 
de seguro. Por ejemplo, la proporción de individuos con de¬ 
ducible bajo de casa como deducible bajo de carro es 0.06 
(6% de todos los individuos). 


Propietario de casa 


Auto 

N 

B 

M 

A 

B 

0.04 

0.06 

0.05 

0.03 

M 

0.07 

0.10 

0.20 

0.10 

A 

0.02 

0.03 

0.15 

0.15 


Suponga que se elige al azar un individuo que posee ambos 

tipos de pólizas. 

a. ¿Cuál es la probabilidad de que el individuo tenga un de¬ 
ducible de auto medio y un deducible de casa alto? 

b. ¿Cuál es la probabilidad de que el individuo tenga un de¬ 
ducible de casa bajo y un deducible de auto bajo? 

c. ¿Cuál es la probabilidad de que el individuo se encuen¬ 
tre en la misma categoría de deducibles de casa y auto? 

d. Basado en su respuesta en el inciso c), ¿cuál es la proba¬ 
bilidad de que las dos categorías sean diferentes? 

e. ¿Cuál es la probabilidad de que el individuo tenga por lo 
menos un nivel deducible bajo? 

f. Utilizando la respuesta del inciso e). ¿cuál es la proba¬ 
bilidad de que ningún nivel deducible sea bajo? 

La ruta utilizada por un automovilista para trasladarse a su 

trabajo contiene dos intersecciones con señales de tránsito. 
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La probabilidad de que tenga que detenerse en la primera 
señal es 0.4, el problema análogo para la segunda señal es 
0.5 y la probabilidad de que tenga que detenerse en por lo 
menos una de las dos señales es 0.6. ¿Cuál es la probabili¬ 
dad de que tenga que detenerse 

a. En ambas señales? 

b. En la primera señal pero no en la segunda? 

c. En exactamente una señal? 

23. Las computadoras de seis miembros del cuerpo de profeso¬ 
res en cierto departamento tienen que ser reemplazadas. 
Dos de ellos seleccionaron computadoras portátiles y los 
otros cuatro escogieron computadoras de escritorio. Su¬ 
ponga que sólo dos de las configuraciones pueden ser rea¬ 
lizadas en un día particular y las dos computadoras que van 
a ser configuradas se seleccionan al azar de entre las seis 
(lo que implica 15 resultados igualmente probables; si las 
computadoras se numeran 1, 2, . . . , 6 entonces un resultado 
se compone de las computadoras 1 y 2, otro de las compu¬ 
tadoras 1 y 3, y así sucesivamente). 

a. ¿Cuál es la probabilidad de que las dos configuraciones 
seleccionadas sean computadoras portátiles? 

b. ¿Cuál es la probabilidad de que ambas configuraciones se¬ 
leccionadas sean computadoras de escritorio? 

c. ¿Cuál es la probabilidad de que por lo menos una configu¬ 
ración seleccionada sea una computadora de escritorio? 

d. ¿Cuál es la probabilidad de que por lo menos una compu¬ 
tadora de cada tipo sea elegida para configurarla? 

24. Demuestre que si un evento A está contenido en otro even¬ 
to B (es decir, A es un subconjunto de B), entonces P(A) £ 
P(B). [Sugerencia'. Con los eventos A y B, A y B Cl A' son 
eventos excluyentes y B = A U (B D A'), como se ve en el 
diagrama de Venn.] Para los eventos Ay B, ¿qué implica es¬ 
to sobre la relación entre P(A CI B), P(A) y P(A U 5)? 

25. Las tres opciones principales en un tipo de carro nuevo son 
una transmisión automática (A), un quemacocos (B) y un 
estéreo con reproductor de discos compactos (C). Si 70% de 
todos los compradores solicitan A, 80% solicitan B, 75% so¬ 
licitan C, 85% solicitan A o B, 90% solicitan A o C, 95% 
solicitan B o C y 98% solicitan A o B o C, calcule las proba¬ 
bilidades de los siguientes eventos. [ Sugerencia: "A o B” es 
el evento en que por lo menos una de las dos opciones es so¬ 
licitada; trate de trazar un diagrama de Venn y rotule todas 
las regiones.] 

a. El siguiente comprador solicitará por lo menos una de 
las tres opciones. 

b. El siguiente comprador no seleccionará ninguna de las 
tres opciones. 
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c. El siguiente comprador solicitará sólo una transmisión 
automática y ninguna otra de las otras dos opciones. 

d. El siguiente comprador seleccionará exactamente una de 
estas tres opciones. 

26. Un sistema puede experimentar tres tipos diferentes de 
defectos. Sea A¡ (i = 1, 2, 3) el evento en que el sistema tie¬ 
ne un defecto de tipo i. Suponga que 

P(Aj) = 0.12 P(A 2 ) = 0.07 P(A 3 ) = 0.05 
P(A 1 U A 2 ) = 0.13 P(A 1 U A 3 ) = 0.14 

p(a 2 u a 3 ) = o.io P(A l n a 2 n a 3 ) = o.oi 

a. ¿Cuál es la probabilidad de que el sistema no tenga un 
defecto de tipo 1? 

b. ¿Cuál es la probabilidad de que el sistema tenga tanto 
defectos de tipo 1 como de tipo 2? 

c. ¿Cuál es la probabilidad de que el sistema tenga tanto 
defectos de tipo 1 como de tipo 2 pero no de tipo 3? 

d. ¿Cuál es la probabilidad de que el sistema tenga a lo su¬ 
mo dos de estos defectos? 

27. Un departamento académico con cinco miembros del cuerpo 
de profesores, Anderson, Box, Cox, Cramer y Fisher, debe 
seleccionar dos de ellos para que participen en un comité de 
revisión de personal. Como el trabajo requerirá mucho tiem¬ 
po, ninguno está ansioso de participar, por lo que se decidió 
que el representante será elegido introduciendo cinco trozos 
de papel en una caja, revolviéndolos y seleccionando dos. 

a. ¿Cuál es la probabilidad de que tanto Anderson como 
Box serán seleccionados? [ Sugerencia: Nombre los re¬ 
sultados igualmente probables.] 

b. ¿Cuál es la probabilidad de que por lo menos uno de los 
dos miembros cuyo nombre comienza con C sea selec¬ 
cionado? 

c. Si los cinco miembros del cuerpo de profesores han dado 
clase durante 3, 6, 7, 10 y 14 años, respectivamente, en la 
universidad, ¿cuál es la probabilidad de que los dos repre¬ 
sentantes seleccionados acumulen por lo menos 15 años 
de experiencia académica en la universidad? 

28. En el ejercicio 5, suponga que cualquier individuo que en¬ 
tre a la clínica tiene las mismas probabilidades de ser asig¬ 
nado a cualquiera de las tres estaciones independientemente 
de adonde hayan sido asignados otros individuos. 

¿Cuál es la probabilidad de que 

a. Los tres miembros de una familia sean asignados a la 
misma estación? 

b. A lo sumo dos miembros de la familia sean asignados a 
la misma estación? 

c. Cada miembro de la familia sea asignado a una estación 
diferente? 


2.3 Técnicas de conteo 


Cuando los diversos resultados de un experimento son igualmente probables (la misma pro¬ 
babilidad es asignada a cada evento simple), la tarea de calcular probabilidades se reduce a 
contar. Sea N el número de resultados en un espacio muestral y N(A) el número de resulta¬ 
dos contenidos en un evento A. 


N 


( 2 . 1 ) 
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Si una lista de resultados es fácil de obtener y N es pequeño, entonces N y N(A) pueden ser 
determinadas sin utilizar ningún principio de conteo. 

Existen, sin embargo, muchos experimentos en los cuales el esfuerzo implicado al ela¬ 
borar la lista es prohibitivo porque N es bastante grande. Explotando algunas reglas de con¬ 
teo generales, es posible calcular probabilidades de la forma (2.1) sin una lista de resultados. 
Estas reglas también son útiles en muchos problemas que implican resultados que no son 
igualmente probables. Se utilizarán varias de las reglas desarrolladas aquí al estudiar distri¬ 
buciones de probabilidad en el siguiente capítulo. 

La regla de producto para pares ordenados 

La primera regla de conteo se aplica a cualquier situación en la cual un conjunto (evento) se 
compone de pares de objetos ordenados y se desea contar el número de pares. Por par orde¬ 
nado, se quiere decir que, si 0¡ y 0 2 son objetos, entonces el par (0¡, 0 2 ) es diferente del 
par ( 0 2 , 0¡). Por ejemplo, si un individuo selecciona una línea aérea para un viaje de Los 
Ángeles a Chicago y (después de realizar transacciones de negocios en Chicago) un segun¬ 
do para continuar a Nueva York, una posibilidad es (American, United), otra es (United, 
American) y otra más es (United, United). 


PROPOSICIÓN 


Si el primer elemento u objeto de un par ordenado puede ser seleccionado de n x ma¬ 
neras y por cada una de estas n ] maneras el segundo elemento del par puede ser se¬ 
leccionado de n 2 maneras, entonces el número de pares es n x n 2 . 



Ejemplo 2.17 El propietario de una casa que va a llevar a cabo una remodelación requiere los servicios 
tanto de un contratista de fontanería como de un contratista de electricidad. Si existen 12 
contratistas de fontanería y 9 contratistas electricistas disponibles en el área, ¿de cuántas 
maneras pueden ser elegidos los contratistas? Sean Pu • •• , Pn los fontaneros y Q¡, . . . , 
Q g los electricistas, entonces se desea el número de pares de la forma (P¡, Q¡). Con n¡ = 12 
y n 2 = 9, la regla de producto da N = (12)(9) =108 formas posibles de seleccionar los 
dos tipos de contratistas. ■ 

En el ejemplo 2.17, la selección del segundo elemento del par no dependió de qué pri¬ 
mer elemento ocurrió o fue elegido. En tanto exista el mismo número de opciones del se¬ 
gundo elemento por cada primer elemento, la regla de producto es válida incluso cuando el 
conjunto de posibles segundos elementos depende del primer elemento. 

Ejemplo 2.18 Una familia se acaba de cambiar a una nueva ciudad y requiere los servicios tanto de un obs- 
tetra como de un pediatra. Existen dos clínicas médicas fácilmente accesibles y cada una tie¬ 
ne dos obstetras y tres pediatras. La familia obtendrá los máximos beneficios del seguro de 
salud si se une a la clínica y selecciona ambos doctores de la clínica. ¿De cuántas maneras 
se puede hacer esto? Denote los obstetras por O u 0 2 , O . y 0 4 y los pediatras por P j, . . . , 
P 6 . Entonces se desea el número de pares ( 0¡,P') para los cuales 0¡ y P¡ están asociados con 
la misma clínica. Como existen cuatro obstetras, n¡ = 4, y por cada uno existen tres opcio¬ 
nes de pediatras, por lo tanto n 2 = 3. Aplicando la regla de producto se obtienen N = 
n l n 2 = 12 posibles opciones. ■ 

En muchos problemas de conteo y probabilidad, se puede utilizar una configuración conoci¬ 
da como diagrama de árbol para representar pictóricamente todas las posibilidades. El dia¬ 
grama de árbol asociado con el ejemplo 2.18 aparece en la figura 2.7. Partiendo de un punto 
localizado en el lado izquierdo del diagrama, por cada posible primer elemento de un par 
emana un segmento de línea recta hacia la derecha. Cada una de estas líneas se conoce como 
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rama de primera generación. Ahora para cualquier rama de primera generación se constru¬ 
ye otro segmento de línea que emana de la punta de la rama por cada posible opción de un 
segundo elemento del par. Cada segmento de línea es una rama de segunda generación. Co¬ 
mo existen cuatro obstetras, existen cuatro ramas de primera generación y tres pediatras por 
cada obstetra se obtienen tres ramas de segunda generación que emanan de cada rama de 
primera generación. 

Generalizando, supóngase que existen n l ramas de primera generación y por cada ra¬ 
ma de primera generación existen n 2 ramas de segunda generación. El número total de ramas 
de segunda generación es entonces n x n 2 . Como el extremo de cada rama de segunda gene¬ 
ración corresponde a exactamente un posible par (la selección de un primer elemento y luego 
de un segundo nos sitúa en el extremo de exactamente una rama de segunda generación), 
existen n , n 2 pares, lo que verifica la regla de producto. 

La construcción de un diagrama de árbol no depende de tener el mismo número de ra¬ 
mas de segunda generación que emanen de cada rama de primera generación. Si la segun¬ 
da clínica tenía cuatro pediatras, entonces habría sólo tres ramas que emanan de dos de las 
ramas de primera generación y cuatro que emanan de cada una de las otras dos ramas de pri¬ 
mera generación. Un diagrama de árbol puede ser utilizado por lo tanto para representar pic¬ 
tóricamente experimentos aparte de aquellos a los que se aplica la regla de producto. 

Una regla de producto más general 

Si se lanza al aire un dado de seis lados cinco veces en sucesión en lugar de sólo dos veces, 
entonces cada posible resultado es un conjunto ordenado de cinco números tal como (1,3, 
1, 2, 4) o (6, 5, 2, 2, 2). Un conjunto ordenado de k objetos recibirá el nombre de k-tupla 
(por tanto un par es un 2-tupla y un triple es un 3-tupla). Cada resultado del experimento del 
lanzamiento al aire de el dado es entonces un 5-tupla. 


Regla de producto para /r-tuplas 

Supóngase que un conjunto se compone de conjuntos ordenados de k elementos 
(Utuplas) y que existen n l posibles opciones para el primer elemento por cada opción 
del primer elemento, existen n 0 posibles opciones del segundo elemento;. . . ; por cada 
posible opción de los primeros k — 1 elementos, existen n k opciones del elemento 
A'-ésimo. Existen entonces n t n 2 . n k posibles Utuplas. 
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Esta regla más general también puede ser ilustrada por un diagrama de árbol; simple¬ 
mente se construye un diagrama más elaborado añadiendo una tercera generación de ramas 
que emanan de la punta de cada segunda generación, luego ramas de cuarta generación, y 
así sucesivamente, hasta que por último se agregan ramas de /r-ésima generación. 


Ejemplo 2.19 

(continuación 
del ejemplo 
2.17) 


Suponga que el trabajo de remodelación de la casa implica adquirir primero varios utensi¬ 
lios de cocina. Se adquirirán en la misma tienda y hay cinco tiendas en el área. Con las tien¬ 
das denotadas por Z3¡, . . ., D s , existen N = n¡n 2 n 3 = (5)(12)(9) = 540 3 tupias de la forma 
(Z3 ; , P¡, Q k ), así que existen 540 formas de elegir primero una tienda, luego un contratista de 
fontanería y finalmente un contratista electricista. ■ 


Ejemplo 2.20\ 

(continuación 
del ejemplo 
2.18) 


Si cada clínica tiene dos especialistas en medicina interna y dos médicos generales, existen 
n t n 2 n 3 n 4 = (4)(3)(3)(2) = 72 formas de seleccionar un doctor de cada tipo de tal suerte que 
todos los doctores practiquen en la misma clínica. ■ 

Permutaciones y combinaciones 


Considérese un grupo de n individuos u objetos distintos (“distintos” significa que existe al¬ 
guna característica que diferencia a cualquier individuo u objeto de cualquier otro). ¿Cuán¬ 
tas maneras existen de seleccionar un subconjunto de tamaño k del grupo? Por ejemplo, si 
un equipo de ligas menores tiene 15 jugadores registrados, ¿cuántas maneras existen de selec¬ 
cionar 9 jugadores para una alineación inicial? O si en su librero tiene 10 libros de misterio no 
leídos y desea seleccionar 3 para llevarlos consigo en unas vacaciones cortas, ¿cuántas ma¬ 
neras existen de hacerlo? 

Una respuesta a la pregunta general que se acaba de plantear requiere distinguir entre 
dos casos. En algunas situaciones, tal como el escenario del béisbol, el orden de la selección 
es importante. Por ejemplo, con Ángela como lanzador y Ben como receptor se obtiene una 
alineación diferente de aquella con Ángela como receptor y Ben como lanzador. A menudo, 
sin embargo, el orden no es importante y a nadie le interesa qué individuos u objetos sean 
seleccionados, como sería el caso en el escenario de selección de libros. 


DEFINICIÓN 


Un subconjunto ordenado se llama permutación. El número de permutaciones de ta¬ 
maño k que se puede formar con los n individuos u objetos en un grupo será denotado 
por P kn . Un subconjunto no ordenado se llama combinación. Una forma de denotar el 
número de combinaciones es C kn , pero en su lugar se utilizará una notación que es bas¬ 
tante común en libros de probabilidad: que se lee “de n se eligen k”. 


El número de permutaciones se determina utilizando la primera regla de conteo para 
^-tupias. Supóngase, por ejemplo, que un colegio de ingeniería tiene siete departamentos, 
denotados por a, b, c, d, e,f y g. Cada departamento tiene un representante en el consejo de 
estudiantes del colegio. De estos siete representantes, uno tiene que ser elegido como presiden¬ 
te, otro como vicepresidente y un tercero como secretario. ¿Cuántas maneras existen para se¬ 
leccionar los tres oficiales? Es decir, ¿cuántas permutaciones de tamaño 3 pueden ser formadas 
con los 7 representantes? Para responder esta pregunta, habrá que pensar en formar una tripleta 
(3-tupla) en la cual el primer elemento es el presidente, el segundo es el vicepresidente y el ter¬ 
cero es el secretario. Una tripleta es ( a , g, b ), otra es (h, g, a ) y otra más es (d,f b). Ahora bien 
el presidente puede ser seleccionado en cualesquiera de n, = 7 formas. Por cada forma de se¬ 
leccionar el presidente, existen n 2 = 6 formas de seleccionar el vicepresidente y por consiguien¬ 
te 7 X 6 = 42 (pares de presidente, vicepresidente). Por último, por cada forma de seleccionar 
un presidente y vicepresidente, existen n 3 = 5 formas de seleccionar el secretario. Esto da 


P X i = (7)(6)(5) = 210 
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como el número de permutaciones de tamaño 3 que se pueden formar con 7 individuos dis¬ 
tintos. Una representación de diagrama de árbol mostraría tres generaciones de ramas. 

La expresión para P 31 puede ser rescrita con la ayuda de notación factorial. Recuér¬ 
dese que 7! (se lee “factorial de 7”) es una notación compacta para el producto descenden¬ 
te de enteros (7)(6)(5)(4)(3)(2)(1). Más generalmente, para cualquier entero positivo m, m\ 
= m(m — 1 )(m — 2) .(2)(1). Esto da 1! = 1 y también se define 0! = 1. Entonces 


P X1 = (7)(6)(5) 


(7) (6) (5) (4!) = 7! 
(4!) 4! 


Más generalmente 

p tn = n ( n - 1)(« - 2). (n — (k - 2))(n — (k — 1)) 

Multiplicando y dividiendo ésta por (n — k)\ se obtiene una expresión compacta para el nú¬ 
mero de permutaciones. 


n\ 

(;n — k )! 


Existen diez asistentes de profesor disponibles para calificar exámenes en un curso de 
cálculo en una gran universidad. El primer examen se compone de cuatro preguntas y el 
profesor desea seleccionar un asistente diferente para calificar cada pregunta (sólo un asis¬ 
tente por pregunta). ¿De cuántas maneras se pueden elegir los asistentes para calificar? En 
este caso n = tamaño del grupo = 10 y k = tamaño del subconjunto = 4. El número de per¬ 
mutaciones es 

’ (10^4)i -f- l0<9)<8)(7) * 5040 

Es decir, el profesor podría aplicar 5040 exámenes diferentes de cuatro preguntas sin utili¬ 
zar la misma asignación de calificadores a preguntas, ¡tiempo en el cual todos los asistentes 
seguramente habrán terminado sus programas de licenciatura! ■ 


Considérense ahora las combinaciones (es decir, subconjuntos ordenados). De nuevo 
habrá que remitirse al escenario de consejo estudiantil y supóngase que tres de los siete re¬ 
presentantes tienen que ser seleccionados para que asistan a una convención estatal. El or¬ 
den de selección no es importante; lo que importa es cuáles tres son seleccionados. Así que 
se busca u), el número de combinaciones de 3 que se pueden formar con los 7 individuos. 
Considérese por un momento las combinaciones a, c, g. Estos tres individuos pueden ser or¬ 
denados en 3! = 6 formas para producir el número de permutaciones: 


a,c,g a,g,c c,a,g c,g,a g,a,c g,c,a 

De manera similar, hay 3! = 6 maneras para ordenar la combinación b, c, e para producir 
combinaciones y de hecho hay 3! modos para ordenar cualquier combinación particular de 
tamaño 3 para producir permutaciones. Esto implica la siguiente relación entre el número 
de combinaciones y el número de permutaciones. 


1 3,7 


(3!) 'GMD 


3! 


7! 

(30(4!) 


(7)(6)(5) 

(3)(2)(1) 



No sería difícil poner en lista las 35 combinaciones, pero no hay necesidad de hacerlo si só¬ 
lo interesa cuántas son. Obsérvese que el número 210 de permutaciones excede por mucho 
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Ejemplo 2.22 


Ejemplo 2.23 


el número de combinaciones; el segundo es más grande que el primero por un factor de 3! 
puesto que así es como cada combinación puede ser ordenada. 

Generalizando la línea de razonamiento anterior se obtiene una relación simple entre 
el número de permutaciones y el número de combinaciones que produce una expresión con¬ 
cisa para la última cantidad. 

í n \_ Pk -n_ n[ 

\k) k\ k\(n — k)\ 

Nótese que Q = 1 y Q = 1 puesto que hay sólo una forma de seleccionar un conjunto 
de (todos) n elementos o de ningún elemento y (") = n puesto que existen n subconjun¬ 
tos de tamaño 1 . 


Una mano de bridge se compone de 13 cartas seleccionadas de entre un mazo de 52 cartas 
sin importar el orden. Existen (3 = 521/13!39! manos de bridge diferentes, lo que asciende a 
aproximadamente 635 000 millones. Como existen 13 cartas de cada palo, el número de ma¬ 
nos compuestas por completo de tréboles y/o espadas (nada de cartas rojas) es (f’j = 
261/13113! = 10400600. Una de estas manos (^j se compone por completo de espadas y una 
se compone por completo de tréboles, por lo tanto existen [(, 3 ) — 2 ] manos compuestas por 
completo de tréboles y espadas con ambos palos representados en la mano. Supóngase que 
una mano de bridge repartida de un mazo bien barajado (es decir, 13 cartas se seleccionan 
al azar de entre 52 posibilidades) y si 


A = {la mano se compone por completo de espadas y tréboles con ambos palos re¬ 
presentados } 

B = {la mano se compone de exactamente dos palos j 


Los N = ( 13 ) posibles resultados son igualmente probables, por lo tanto 


P(A) 


N(A) 

N 



0.0000164 


Como existen ( 2 J = 6 combinaciones compuestas de dos palos, de las cuales espadas y tré¬ 
boles es una de esas combinaciones, 


P(B) 



0.0000983 


Es decir, una mano compuesta por completo de cartas de exactamente dos de los cuatro pa¬ 
los ocurrirá aproximadamente una vez por cada 100 000 manos. Si juega bridge sólo una 
vez al mes, es probable que nunca le repartan semejante mano. ■ 


El almacén de una universidad recibió 25 impresoras, de las cuales 10 son impresoras láser 
y 15 son modelos de inyección de tinta. Si 6 de estas 25 se seleccionan al azar para que las 
revise un técnico particular, ¿cuál es la probabilidad de que exactamente 3 de las seleccio¬ 
nadas sean impresoras láser (de modo que las otras 3 sean de inyección de tinta)? 

Sea D 3 = {exactamente 3 de las 6 seleccionadas son impresoras de inyección de tin¬ 
ta}. Suponiendo que cualquier conjunto particular de 6 impresoras es tan probable de ser ele¬ 
gido como cualquier otro conjunto de 6 , se tienen resultados igualmente probables, por lo 
tanto P(D 3 ) = N(D 3 )/N, donde N es el número de formas de elegir 6 impresoras de entre las 
25 y N(D 3 ) es el número de formas de elegir 3 impresoras láser y 3 de inyección de tinta. Por 
lo tanto N = ( 2 6 5 ). Para obtener N(D 3 ), primero se piensa en elegir 3 de las 15 impresoras de 
inyección de tinta y luego 3 de las impresoras láser. Existen (j 5 ) formas de elegir las 3 im¬ 
presoras de inyección de tinta y ( 3 °) formas de elegir las 3 impresoras láser; N(D 3 ) es ahora 
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el producto de estos dos números (visualícese un diagrama de árbol, en realidad aquí se está 
utilizando el argumento de la regla de producto), por lo tanto 


p(d 3 ) 


N(D 3 ) 

N 



15! 10! 

3! 12! ' 3!7! 
25! 

6 ! 19! 


0.3083 


Sea D 4 = {exactamente 4 de las 6 impresoras seleccionadas son impresoras de inyección de 
tinta) y defínanse D 5 y D 6 del mismo modo. Entonces la probabilidad de seleccionar por lo 
menos 3 impresoras de inyección de tinta es 
P(D 3 UD 4 UD 5 U D 6 ) = P(D 3 ) + P(D 4 ) + P{D 5 ) + P(l\) 



EJERCICIOS Sección 2.3 (29-44) 


29. Con fecha de abril de 2006, aproximadamente 50 millones 31. 
de nombres de dominio web.com fueron registrados (p. ej., 
yahoo.com). 

a. ¿Cuántos nombres de dominio compuestos de exacta¬ 
mente dos letras pueden ser formados? ¿Cuántos nom¬ 
bres de dominio de dos letras existen si como caracteres 
se permiten dígitos y números? [Nota: Una longitud de 
carácter de tres o más ahora es obligatoria.] 

b. ¿Cuántos nombres de dominio existen compuestos de 
tres letras en secuencia? ¿Cuántos de esta longitud exis¬ 
ten si se permiten letras o dígitos? [Nota: En la actuali¬ 
dad todos están utilizados.] 

c. Responda las preguntas hechas en b) para secuencias de 
cuatro caracteres. 

d. Con fecha de abril de 2006, 97 786 de las secuencias de 
cuatro caracteres utilizando letras o dígitos aún no ha¬ 
bían sido reclamadas. Si se elige un nombre de cuatro 
caracteres al azar, ¿cuál es la probabilidad de que ya ten¬ 
ga dueño? 

30. Un amigo mío va a ofrecer una fiesta. Sus existencias actua¬ 
les de vino incluyen 8 botellas de zinfandel, 10 de merlot y 
12 de cabernet (él sólo bebe vino tinto), todos de diferentes 
fábricas vinícolas. 

a. Si desea servir 3 botellas de zinfandel y el orden de servi¬ 
cio es importante, ¿cuántas formas existen de hacerlo? 

b. Si 6 botellas de vino tienen que ser seleccionadas al azar 
de las 30 para servirse, ¿cuántas formas existen de ha¬ 
cerlo? 

c. Si se seleccionan al azar 6 botellas, ¿cuántas formas 
existen de obtener dos botellas de cada variedad? 

d. Si se seleccionan 6 botellas al azar, ¿cuál es la probabili¬ 
dad de que el resultado sea dos botellas de cada variedad? 

e. Si se eligen 6 botellas al azar, ¿cuál es la probabilidad de 
que todas ellas sean de la misma variedad. 


a. Beethoven escribió 9 sinfonías y Mozart 27 conciertos 
para piano. Si el locutor de una estación de radio de una 
universidad desea tocar primero una sinfonía de Beetho¬ 
ven y luego un concierto de Mozart, ¿de cuántas mane¬ 
ras puede hacerlo? 

b. El gerente de la estación decide que en cada noche sucesi¬ 
va (7 días a la semana), se tocará una sinfonía de Beetho¬ 
ven, seguida por un concierto para piano de Mozart, 
seguido por un cuarteto de cuerdas de Schubert (de los 
cuales existen 15). ¿Durante aproximadamente cuántos 
años se podría continuar con esta política antes de que 
exactamente el mismo programa se repitiera? 

32. Una tienda de equipos de sonido está ofreciendo un precio 
especial en un juego completo de componentes (receptor, 
reproductor de discos compactos, altavoces, casetera). Al 
comprador se le ofrece una opción de fabricante por ca¬ 
da componente. 


Receptor: Kenwood, Onkyo, Pioneer, Sony, Sherwood 
Reproductor de discos compactos: Onkyo, Pioneer, Sony, 
Technics 

Altavoces: Boston, Infinity, Polk 
Casetera: Onkyo, Sony, Teac, Technics 


Un tablero de distribución en la tienda permite al cliente co¬ 
nectar cualquier selección de componentes (compuesta de 
uno de cada tipo). Use las reglas de producto para respon¬ 
der las siguientes preguntas. 

a. ¿De cuántas maneras puede ser seleccionado un compo¬ 
nente de cada tipo? 

b. ¿De cuántas maneras pueden ser seleccionados los com¬ 
ponentes si tanto el receptor como el reproductor de dis¬ 
cos compactos tienen que ser Sony? 
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c. ¿De cuántas maneras pueden ser seleccionados los com¬ 
ponentes si ninguno tiene que ser Sony? 

d. ¿De cuántas maneras se puede hacer una selección si por 
lo menos se tiene que incluir un componente Sony? 

e. Si alguien mueve los interruptores en el tablero de distri¬ 
bución completamente al azar, ¿cuál es la probabilidad 
de que el sistema seleccionado contenga por lo menos un 
componente Sony? ¿Exactamente un componente Sony? 

33. De nuevo considere el equipo de ligas menores que tiene 
15 jugadores en su plantel. 

a. ¿Cuántas formas existen de seleccionar 9 jugadores pa¬ 
ra la alineación inicial? 

b. ¿Cuántas formas existen de seleccionar 9 jugadores para la 
alineación inicial y un orden al bat de los 9 inicialistas? 

c. Suponga que 5 de los 15 jugadores son zurdos. ¿Cuántas 
formas existen de seleccionar 3 jardineros zurdos y tener 
las otras 6 posiciones ocupadas por jugadores derechos? 

34. Poco tiempo después de ser puestos en servicio, algunos au¬ 
tobuses fabricados por una cierta compañía presentaron 
grietas debajo del chasis principal. Suponga que una ciudad 
particular utiliza 25 de estos autobuses y que en 8 de ellos 
aparecieron grietas. 

a. ¿Cuántas maneras existen de seleccionar una muestra de 
5 autobuses de entre los 25 para una inspección completa? 

b. ¿De cuántas maneras puede una muestra de 5 autobuses 
contener exactamente 4 con grietas visibles? 

c. Si se elige una muestra de 5 autobuses al azar, ¿cuál es 
la probabilidad de que exactamente 4 de los 5 tengan 
grietas visibles? 

d. Si los autobuses se seleccionan como en el inciso c), 
¿cuál es la probabilidad de que por lo menos 4 de los 
seleccionados tengan grietas visibles? 

35. Una empresa de producción emplea 20 trabajadores en el 
tumo de día, 15 en el turno de tarde y 10 en el tumo de me¬ 
dianoche. Un consultor de control de calidad va a seleccionar 
6 de estos trabajadores para entrevistas a fondo. Suponga 
que la selección se hace de tal modo que cualquier grupo 
particular de 6 trabajadores tiene la misma oportunidad de 
ser seleccionado al igual que cualquier otro grupo (sacando 
6 papelitos de entre 45 sin reemplazarlos). 

a. ¿Cuántas selecciones resultarán en que los 6 trabajado¬ 
res seleccionados provengan del turno de día? 

b. ¿Cuál es la probabilidad de que los 6 trabajadores selec¬ 
cionados sean del mismo turno? 

c. ¿Cuál es la probabilidad de que por lo menos dos tumos 
diferentes estarán representados entre los trabajadores 
seleccionados? 

d. ¿Cuál es la probabilidad de que por lo menos uno de 
los tumos no estará representado en la muestra de tra¬ 
bajadores? 

36. Un departamento académico compuesto de cinco profeso¬ 
res limitó su opción para jefe de departamento a el candida¬ 
to A o el candidato B. Cada miembro votó entonces con un 
papelito por uno de los candidatos. Suponga que en realidad 
existen tres votos para A y dos para B. Si los papelitos se 
cuentan al azar, ¿cuál es la probabilidad de que A perma¬ 
nezca delante de B durante todo el conteo de votos (p. ej. 
¿ocurre este evento si el orden seleccionado es AABAB pe¬ 
ro no si es ABBAA)7 


37. Un experimentador está estudiando los efectos de la tempe¬ 
ratura, la presión y el tipo de catalizador en la producción 
de cierta reacción química. Tres diferentes temperaturas, 
cuatro presiones distintas y cinco catalizadores diferentes se 
están considerando. 

a. Si cualquier experimento particular implica utilizar una 
temperatura, una presión y un catalizador, ¿cuántos ex¬ 
perimentos son posibles? 

b. ¿Cuántos experimentos existen que impliquen el uso de 
la temperatura más baja y dos presiones bajas? 

c. Suponga que se tienen que realizar cinco experimentos 
diferentes el primer día de experimentación. Si los cin¬ 
co se eligen al azar de entre todas las posibilidades, de 
modo que cualquier grupo de cinco tenga la misma pro¬ 
babilidad de selección, ¿cuál es la probabilidad de que 
se utilice un catalizador diferente en cada experimento? 

38. Una caja en un almacén contiene cuatro focos de 40 W, cin¬ 
co de 60 W y seis de 75 W. Suponga que se eligen al azar 
tres focos. 

a. ¿Cuál es la probabilidad de que exactamente dos de los 
focos seleccionados sean de 75 W? 

b. ¿Cuál es la probabilidad de que los tres focos seleccio¬ 
nados sean de los mismos watts? 

c. ¿Cuál es la probabilidad de que se seleccione un foco de 
cada tipo? 

d. Suponga ahora que los focos tienen que ser selecciona¬ 
dos uno por uno hasta encontrar uno de 75 W. ¿Cuál es 
la probabilidad de que sea necesario examinar por lo 
menos seis focos? 

39. Quince teléfonos acaban de llegar a un centro de servicio 
autorizado. Cinco de éstos son celulares, cinco inalámbri¬ 
cos y los otros cincos alámbricos. Suponga que a estos com¬ 
ponentes se les asignan al azar los números 1, 2, . . . , 15 
para establecer el orden en que serán reparados. 

a. ¿Cuál es la probabilidad de que los teléfonos inalámbri¬ 
cos estén entre los primeros diez que van a ser reparados? 

b. ¿Cuál es la probabilidad de que después de reparar diez 
de estos teléfonos, sólo dos de los tres tipos de teléfonos 
queden para ser reparados? 

c. ¿Cuál es la probabilidad que dos teléfonos de cada tipo 
estén entre los primeros seis reparados? 

40. Tres moléculas de tipo A, tres de tipo B , tres de tipo C y tres 
de tipo D tienen que ser unidas para formar una cadena mo¬ 
lecular. Una cadena molecular como esa es ABCDABC- 
DABCD y otra es BCDDAAABDBCC. 

a. ¿Cuántas moléculas en cadena hay? [Sugerencia: si se 
pudieran distinguir entre sí las tres letras A, A v A 2 , A 3 , y 
también las letras B, C y D, ¿cuántas moléculas del tipo 
habría? ¿Cómo se reduce este número cuando se elimi¬ 
nan de las letras A los subíndices? 

b. Suponga que se elige al azar una molécula del tipo des¬ 
crito. ¿Cuál es la probabilidad de que las tres molécu¬ 
las de cada tipo terminen una junto a la otra (como en 
BBBAAADDD CCC)7 

41. Una profesora de matemáticas desea programar una cita 
con cada uno de sus ochos asistentes, cuatro hombres y cua¬ 
tro mujeres, para discutir su curso de cálculo. Suponga que 
todos los posibles ordena mientos de citas tienen la misma 
probabilidad de ser seleccionados. 
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a. ¿Cuál es la probabilidad de que por lo menos una mujer 
asistente quede entre los primeros tres con quien la pro¬ 
fesora se reúna? 

b. ¿Cuál es la probabilidad de que después de las primeras 
cinco citas se haya reunido con todas las asistentes mu¬ 
jeres? 

c. Suponga que la profesora tiene los mismos ocho asisten¬ 
tes el siguiente semestre y de nuevo programa citas sin 
importar el orden que hubo durante el primer semestre. 
¿Cuál es la probabilidad de que los ordenamientos de las 
citas sean diferentes? 

42. Tres parejas de casados compraron boletos para el teatro y 
están sentados en una fila compuesta de sólo seis asientos. 
Si ocupan sus asientos de un modo completamente al azar 
(orden aleatorio), ¿cuál es la probabilidad de que Jim y Paula 
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(esposo y esposa) se sienten en los dos asientos extremos 
del lado izquierdo? ¿Cuál es la probabilidad de que Jim y 
Paula terminen sentándose uno junto al otro? ¿Cuál es la 
probabilidad de que por lo menos dos de las esposas termi¬ 
nen sentándose al lado de su esposo? 

43. En un juego de poker de cinco cartas, una escalera se com¬ 
pone de cinco cartas con denominaciones adyacentes (p. ej. 

9 de tréboles, 10 de corazones, joto de corazones, reina de 
espadas y rey de tréboles). Suponiendo que los ases pue¬ 
den estar arriba o abajo, si le reparten una mano de cinco 
cartas, ¿cuál es la probabilidad que será una escalera con un 

10 como carta alta? ¿Cuál es la probabilidad de que sea una 
escalera del mismo palo? 

44. Demuestre que (".) = L" t ). Dé una interpretación que im¬ 
plique subconjuntos. 


2.4 Probabilidad condicional 


Las probabilidades asignadas a varios eventos dependen de lo que se sabe sobre la situación 
experimental cuando se hace la asignación. Subsiguiente a la asignación inicial puede lle¬ 
gar a estar disponible información parcial pertinente al resultado del experimento. Tal infor¬ 
mación puede hacer que se revisen algunas de las asignaciones de probabilidad. Para un 
evento particular A, se ha utilizado P(A ) para representar la probabilidad asignada a A; aho¬ 
ra se considera P(A) como la probabilidad original no condicional del evento A. 

En esta sección, se examina cómo afecta la información de que “un evento B ha ocu¬ 
rrido” a la probabilidad asignada a A. Por ejemplo, A podría referirse a un individuo que su¬ 
fre una enfermedad particular en la presencia de ciertos síntomas. Si se realiza un examen 
de sangre en el individuo y el resultado es negativo (B = examen de sangre negativo), en¬ 
tonces la probabilidad de que tenga la enfermedad cambiará (deberá reducirse, pero no a ce¬ 
ro, puesto que los exámenes de sangre no son infalibles). Se utilizará la notación P(A \ B) 
para representar la probabilidad condicional de A dado que el evento B haya ocurrido. 
B es el “evento condicionante”. 

Por ejemplo, considérese el evento A en que un estudiante seleccionado al azar en su 
universidad obtuvo todas las clases deseadas durante el ciclo de inscripciones del semestre 
anterior. Presumiblemente P(A) no es muy grande. Sin embargo, supóngase que el estudian¬ 
te seleccionado es un atleta con prioridad de inscripción especial (el evento B ). Entonces 
P(A | B ) deberá ser sustancialmente más grande que P(A), aunque quizá aún no cerca de 1. 

Ejemplo 2.24 En una planta se ensamblan componentes complejos en dos líneas de ensamble diferentes, 
A y A'. La línea A utiliza equipo más viejo que A', por lo que es un poco más lenta y me¬ 
nos confiable. Suponga que en un día dado la línea A ensambla 8 componentes, de los cua¬ 
les 2 han sido identificados como defectuosos ( B ) y 6 como no defectuosos (/?'), mientras 
que A' ha producido 1 componente defectuoso y 9 no defectuosos. Esta información se re¬ 
sume en la tabla adjunta. 




Condición 




B 

B' 


A 

2 

6 

Línea 

A' 

1 

9 


Ajeno a esta información, el gerente de ventas selecciona al azar 1 de estos 18 componen¬ 
tes para una demostración. Antes de la demostración 
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P(componente de la línea A seleccionado) = PÍA ) 


NÍA) 

N 


— = 0.44 
18 


No obstante, si el componente seleccionado resulta defectuoso, entonces el evento B ha ocu¬ 
rrido, por lo que el componente debe haber sido 1 de los 3 de la columna B de la tabla. Co¬ 
mo estos 3 componentes son igualmente probables entre ellos mismos una vez que B ha 
ocurrido. 


P(A\B) = - = 


_ 2 _ 

18 

18 


P(A n B) 
P(B ) 


( 2 . 2 ) 


En la ecuación (2.2), la probabilidad condicional está expresada como una razón de 
probabilidades incondicionales. El numerador es la probabilidad de la intersección de los 
dos eventos, en tanto que el denominador es la probabilidad del evento condicionante B. Un 
diagrama de Venn ilustra esta relación (figura 2.8). 



Figura 2.8 Motivación para la definición de probabilidad condicional. 

Dado que B ha ocurrido, el espacio muestral pertinente ya no es S pero consta de re¬ 
sultados en B\ A ha ocurrido si y sólo si uno de los resultados en la intersección ocurrió, así 
que la probabilidad condicional de A dado B es proporcional a P(A D B). Se utiliza la cons¬ 
tante de proporcionalidad 1 /P(B) para garantizar que la probabilidad P(B | B) del nuevo es¬ 
pacio muestral B sea igual a 1. 

Definición de probabilidad condicional 

El ejemplo 2.24 demuestra que cuando los resultados son igualmente probables, el cálculo 
de probabilidades condicionales puede basarse en intuición. Cuando los experimentos son 
más complicados, la intuición puede fallar, así que se requiere una definición general de pro¬ 
babilidad condicional que dé respuestas intuitivas en problemas simples. El diagrama de 
Venn y la ecuación (2.2) sugieren cómo proceder. 


DEFINICIÓN 


Para dos eventos cualesquiera Ay B con P(B) > 0, la probabilidad condicional de 
A dado que B ha ocurrido está definida por 


P(A I B) 


P(A n B) 
P(B ) 


(2.3) 


Ejemplo 2.25 


Supóngase que de todos los individuos que compran cierta cámara digital, 60% incluye 
una tarjeta de memoria opcional en su compra, 40% incluyen una batería extra y 30% inclu¬ 
yen tanto una tarjeta como una batería. Considere seleccionar al azar un comprador y sea 
A = {tarjeta de memoria adquirida} y B = {batería adquirida}. Entonces PÍA) = 0.60, 
P(B) = 0.40 y P(ambas adquiridas) = P(A D B) = 0.30. Dado que el individuo seleccionado 
adquirió una batería extra, la probabilidad de que una tarjeta opcional también sea adquirida es 


P(A I B) 


P(A n B) 
P(B) 


0.30 

0.40 


0.75 
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Ejemplo 2.26 


e 
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Es decir, de todos los que adquieren una batería extra, 75% adquirieron una tarjeta de me¬ 
moria opcional. Asimismo, 


Pf batería | tarjeta de memoria) = P(B | A) = 
Obsérvese que P(A \ B ) P{A) y P(B \ A) P(B). 


P(A D B) 0.30 


P(A) 


0.60 


= 0.50 


El evento cuya probabilidad se desea podría ser una unión o intersección de otros eventos y 
lo mismo podría ser cierto del evento condicionante. 


Una revista de noticias publica tres columnas tituladas “Arte” (A), “Libros” (B) y “Cine” 
(C). Los hábitos de lectura de un lector seleccionado al azar con respecto a estas columnas 
son 

Lee con regularidad A B C APIS AílC SflC AflíílC 

Probabilidad 0.14 0.23 0.37 0.08 0.09 0.13 0.05 

La figura 2.9 ilustra las probabilidades pertinentes. 



Figura 2.9 Diagrama de Venn para el ejemplo 2.26. 

Por lo tanto se tiene 

P(A D B) 0.08 


P(A B) = -- = —- = 0.348 

1 P(B) 0.23 

P(A n (B U O) 0.04 + 0.05 + 0.03 


P(A\B U C) = 


0.12 


P(B U C) 

P(A I lee por lo menos una) = P(A IA U B U C) = 


= 0.255 


0.47 0.47 

P(A D (A U B U O) 


P(AU BU C ) 


P(A) 


0.14 


P(A U B U C) 0.49 


= 0.286 


, P((A U B) D C) 0.04 + 0.05 + 0.08 
P{A U B C) = ——-- = -—- = 0.459 


P(C) 


0.37 


Regla de multiplicación para P{A n B) 

La definición de probabilidad condicional da el siguiente resultado, obtenido multiplicando 
ambos miembros de la ecuación (2.3) por P(B). 




La regla de multiplicación 

P(A D B) = P(A | B) • P(B) 
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Esta regla es importante porque a menudo se desea obtener P(A D B), en tanto que 
P(B) y P(A | B) pueden ser especificadas a partir de la descripción del problema. La consi¬ 
deración de P(B | A) da PÍA D B) = P(B \ A) ■ P(A). 


Ejemplo 2.27 Cuatro individuos han respondido a una solicitud de un banco de sangre para donaciones de 
sangre. Ninguno de ellos ha donado antes, por lo que sus tipos de sangre son desconocidos. 
Suponga que sólo se desea el tipo 0+ y sólo uno de los cuatro tiene ese tipo. Si los dona¬ 
dores potenciales se seleccionan en orden aleatorio para determinar su tipo de sangre, ¿cuál 
es la probabilidad de que por los menos tres individuos tengan que ser examinados para de¬ 
terminar su tipo de sangre y obtener el tipo deseado? 

Haciendo la identificación B = {primer tipo no 0+} y A = {segundo tipo no 0+ }, 
P(B) = j. Dado que el primer tipo no es 0+, dos de los tres individuos que quedan no son 
0+, por lo tanto P(A B) = La regla de multiplicación ahora da 

P( por lo menos tres individuos fueron examinados 

para determinar su tipo de sangre) = P(A fl B) 

= P(A | B) • P(B ) 

_ 2 3 _ _ _ 6 _ 

3 ' 4 ~~ 12 

= 0.5 ■ 

La regla de multiplicación es más útil cuando los experimentos se componen de va¬ 
rias etapas en sucesión. El evento condicionante B describe entonces el resultado de la pri¬ 
mera etapa y A el resultado de la segunda, de modo que P(A \ B), condicionada en lo que 
ocurra primero, a menudo será conocida. La regla es fácil de ser ampliada a experimentos 
que implican más de dos etapas. Por ejemplo, 

p(A 1 n a 2 n a 3 ) = p(A 3 \a 1 n a 2 ) • p(A l n a 2 ) 

= P(A 3 1 Aj n A 2 ) • P(A 2 | Aj) • PiAJ (2.4) 

donde Aj ocurre primero, seguido por A 2 y finalmente A 3 . 


Ejemplo 2.28 Para el experimento de determinación de tipo de sangre del ejemplo 2.27, 


P(el tercer tipo es 0 +) 


P(el tercero es | el primero no es H el segundo no es) 

• P(el segundo no es | el primero no es) • Piel primero no es) 


111 
2 ’ 3 ’ 4 


1 

- = 0.25 
4 


Cuando el experimento de interés se compone de una secuencia de varias etapas, es 
conveniente representarlas con diagrama de árbol. Una vez que se tiene un diagrama de ár¬ 
bol apropiado, las probabilidades y las probabilidades condicionales pueden ser ingresadas 
en las diversas ramas; esto implicará el uso repetido de la regla de multiplicación. 


Ejemplo 2.29 Una cadena de tiendas de video vende tres marcas diferentes de reproductores de DVD. De 
sus ventas de reproductores de DVD, 50% son de la marca 1 (la menos cara), 30% son de 
la marca 2 y 20% son de la marca 3. Cada fabricante ofrece 1 año de garantía en las partes 
y mano de obra. Se sabe que 25% de los reproductores de DVD de la marca 1 requieren tra¬ 
bajo de reparación dentro del periodo de garantía, mientras que los porcentajes correspon¬ 
dientes de las marcas 2 y 3 son 20% y 10%, respectivamente. 

1. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un repro¬ 
ductor de DVD marca 1 que necesitará reparación mientras se encuentra dentro de garantía? 

2. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un re¬ 
productor de DVD que necesitará reparación mientras se encuentra dentro de garantía. 

3. Si un cliente regresa a la tienda con un reproductor de DVD que necesita reparación den¬ 
tro de garantía, ¿cuál es la probabilidad de que sea un reproductor de DVD marca 1? 
¿Un reproductor de DVD marca 2? ¿Un reproductor de DVD marca 3? 
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La primera etapa del problema implica un cliente que selecciona una de las tres mar¬ 
cas de reproductor de DVD. Sea A, = {marca i adquirida), con i = 1, 2 y 3. Entonces P(A, 
= 0.50, P(A 2 ) = 0.30 y P(A 3 ) = 0.20. Una vez que se selecciona una marca de reproductor 
de DVD, la segunda etapa implica observar si el reproductor de DVD seleccionado necesita 
reparación dentro de garantía. Con B = {necesita reparación) y B' = {no necesita repara¬ 
ción), la información dada implica que P(B | Aj) = 0.25, P(B \ A 2 ) = 0.20 y P(B | A 3 ) = 0.10. 

El diagrama de árbol que representa esta situación experimental se muestra en la fi¬ 
gura 2.10. Las ramas iniciales corresponden a marcas diferentes de reproductores de DVD; 
hay dos ramas de segunda generación que emanan de la punta de cada rama inicial, una pa¬ 
ra “necesita reparación” y la otra para “no necesita reparación”. La probabilidad de que 
P(A¡) aparezca en la rama í-ésima inicial, en tanto que las probabilidades condicionales 
P{B | A¡) y P(B' | A ; ) aparecen en las ramas de segunda generación. A la derecha de cada ra¬ 
ma de segunda generación correspondiente a la ocurrencia de B, se muestra el producto de 
probabilidades en las ramas que conducen hacia fuera de dicho punto. Esta es simplemente 
la regla de multiplicación en acción. La respuesta a la pregunta planteada en 1 es por lo tan¬ 
to P(A l (15) = P(B | Aj) • P(Aj) = 0.125. La respuesta a la pregunta 2 es 

P(B ) = /-'[(marca 1 y reparación) o (marca 2 y reparación) o (marca 3 y reparación)] 


= P(A 1 (15) + P(A 2 DB) + P(A 3 n B) 
= 0.125 + 0.060 + 0.020 = 0.205 



P(B\A l )-P(A l ) = P(BnA[) = 0.125 


e 


e 


P(B \ A 2 ) ■ P(A 2 ) = P(B(AA 2 ) = 0.060 


P(B | A 3 ) • P(A¡) = P(B O A 3 ) = 0.020 


P(B ) = 0.205 


Figura 2.10 Diagrama de árbol para el ejemplo 2.29. 


Finalmente, 



P(A 3 1 B) = 1 - P(A l | B) - P{A 2 1 B) = 0.10 


y 
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La probabilidad previa o inicial de la marca 1 es 0.50. Una vez que se sabe que el repro¬ 
ductor de DVD seleccionado necesitaba reparación, la probabilidad posterior de la marca 1 se 
incrementa a 0.61. Esto se debe a que es más probable que los reproductores de DVD marca 1 
necesiten reparación de garantía que las demás marcas. La probabilidad posterior de la marca 
3 es P{A 3 1 B) = 0.10, la cual es mucho menor que la probabilidad previa P(A 3 ) = 0.20. ■ 

Teorema de Bayes 

El cálculo de una probabilidad posterior P{A ¡ | B) a partir de probabilidades previas dadas 
P(A¡) y probabilidades condicionales P(B | A¡) ocupa una posición central en la probabilidad 
elemental. La regla general de dichos cálculos, los que en realidad son una aplicación sim¬ 
ple de la regla de multiplicación, se remonta al reverendo Thomas Bayes, quien vivió en el 
siglo xvm. Para formularla primero se requiere otro resultado. Recuérdese que los eventos 
Aj, . . . , A k son mutuamente excluyentes si ninguno de los dos tiene resultados comunes. 
Los eventos son exhaustivos si un A¡ debe ocurrir, de modo que Aj U ■ ■ • U A k = S. 



Ley de probabilidad total 

Sean A L ,. . . , A k eventos mutuamente excluyentes y exhaustivos. Entonces para cual¬ 
quier otro evento B, 

P{B) = P(B | Aj^Aj) + ■■■ + P(B\ A k )P(A k ) (2.5) 

= ±P(B\A i )P(A ¡ ) 

1=1 



Comprobación Como los eventos A¡ son mutuamente excluyentes y exhaustivos, si B ocu¬ 
rre debe ser en forma conjunta con uno de los eventos A¡ de manera exacta. Es decir, 
B = (Aj n B) U ■ ■ • U (A k D B), donde los eventos (A ; D B) son mutuamente excluyentes. 
Esta “partición de B ” se ilustra en la figura 2.11. Por lo tanto 

k k 

P(B) = 2 P(A i n B) = 2 P(B | A¡)P(A¡) 
i= 1 1=1 

como se deseaba. 



Figura 2.11 División de B entre A¡ mutuamente excluyentes y exhaustivas. ■ 


Un ejemplo del uso de la ecuación (2.5) apareció al responder la pregunta 2 del 
ejemplo 2.29, donde A { = {marca 1}, A 2 = {marca 2¡, A 3 = {marca 3} y B = {repa¬ 
ración}. 
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Ejemplo 2.30 


e 
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Teorema de Bayes 

Sean A v A 2 , ... ,A t un conjunto de eventos mutuamente excluyentes y exhaustivos 
con probabilidades previas P(A¡)(i = 1 ,... ,k). Entonces para cualquier otro evento 
B para el cual P(B) > 0, la probabilidad posterior de A¡ dado que B ha ocurrido es 

P(B\Aj)P(Aj) 

T-~- ~ - j=h...,k (2.6) 

I P{B\A¡) • P{A¡) 

i=l 


p(A¡ n B) 

P{A , I B) = - L - 

J ' P(B) 


La transición de la segunda a la tercera expresión en (2.6) se apoya en el uso de la re¬ 
gla de multiplicación en el numerador y la ley de probabilidad total en el denominador. La 
proliferación de eventos y subíndices en (2.6) puede ser un poco intimidante para los recién 
llegados a la probabilidad. Mientras existan relativamente pocos eventos en la repartición, 
se puede utilizar un diagrama de árbol (como en el ejemplo 2.29) como base para calcular 
probabilidades posteriores sin jamás referirse de manera explícita al teorema de Bayes. 

Incidencia de una enfermedad rara. Sólo 1 de 1000 adultos padece una enfermedad rara pa¬ 
ra la cual se ha creado una prueba de diagnóstico. La prueba es tal que cuando un individuo 
que en realidad tiene la enfermedad, un resultado positivo se presentará en 99% de las ve¬ 
ces mientras que en individuos sin enfermedad el examen será positivo sólo en un 2% de las 
veces. Si se somete a prueba un individuo seleccionado al azar y el resultado es positivo, 
¿cuál es la probabilidad de que el individuo tenga la enfermedad? 

Para utilizar el teorema de Bayes, sea A¡ = {el individuo tiene la enfermedad}, A 2 = 
{el individuo no tiene la enfermedad} y B = {resultado de prueba positivo}. Entonces 
P(A j) = 0.001, P(A 2 ) = 0.999, P(B | A¡) = 0.99 y P(B | A 2 ) = 0.02. El diagrama de árbol 
para este problema aparece en la figura 2.12. 



Figura 2.12 Diagrama de árbol para el problema de la enfermedad rara. 


Junto a cada rama correspondiente a un resultado positivo de prueba, la regla de mul¬ 
tiplicación da las probabilidades anotadas. Por consiguiente, P(B) = 0.00099 + 0.01998 = 
0.02097, a partir de la cual se tiene 


P{A X \B) 


P(A l n B) 
P(B) 


0.00099 

0.02097 


0.047 


Este resultado parece contraintuitivo; la prueba de diagnóstico parece tan precisa que es al¬ 
tamente probable que alguien con un resultado positivo de prueba tenga la enfermedad, mien¬ 
tras que la probabilidad condicional calculada es de sólo 0.047. Sin embargo, como la 
enfermedad es rara y la prueba es sólo moderadamente confiable, surgen más resultados 
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positivos de prueba a causa de errores y no de individuos enfermos. La probabilidad de tener 
la enfermedad se ha incrementado por un factor de multiplicación de 47 (desde la probabili¬ 
dad previa de 0.001 hasta la probabilidad posterior de 0.047); pero para incrementar aún más 
la probabilidad posterior, se requiere una prueba de diagnóstico con tasas de error mucho 
más pequeñas. Si la enfermedad no fuera tan rara (p. ej., 25% de incidencia en la población), 
entonces las tasas de error de la prueba actual proporcionaría buenos diagnósticos. ■ 


EJERCICIOS Sección 2.4 (45-69) 


45. La población de un país particular se compone de tres gru¬ 
pos étnicos. Cada individuo pertenece a uno de los cuatro 
grupos sanguíneos principales. La tabla de probabilidad 
conjunta anexa da la proporción de individuos en las diver¬ 
sas combinaciones de grupo étnico-grupo sanguíneo. 

Grupo sanguíneo 

O A B AB 


I 0.082 0.106 0.008 0.004 

Grupo étnico 2 0.135 0.141 0.018 0.006 

3 0.215 0.200 0.065 0.020 

Suponga que se selecciona un individuo al azar de la pobla¬ 
ción y que los eventos se definen como A = {tipo A seleccio¬ 
nado}, B = ¡tipo B seleccionado} y C = ¡grupo étnico 3 
seleccionado}. 

a. Calcule P(A), P(C ) y P(A D C). 

b. Calcule tanto P(A \ C) y P(C | A) y explique en contex¬ 
to lo que cada una de estas probabilidades representa. 

c. Si el individuo seleccionado no tiene sangre de tipo B, 
¿cuál es la probabilidad de que él o ella pertenezca al 
grupo étnico 1 ? 

46. Suponga que un individuo es seleccionado al azar de la po¬ 
blación de todos los adultos varones que viven en Estados 
Unidos. Sea A el evento en que el individuo seleccionado 
tiene una estatura de más de 6 pies y sea B el evento 
en que el individuo seleccionado es un jugador profesional 
de básquetbol. ¿Cuál piensa que es más grande, P{A \ B) o 
P(B | A)? ¿Por qué? 

47. Regrese al escenario de la tarjeta de crédito del ejercicio 12 
(sección 2.2), donde A = {Visa}, B = {MasterCard}, P(A) = 
0.5, P{B) = 0.4 y P(A fl B) = 0.25. Calcule e interprete ca¬ 
da una de las siguientes probabilidades (un diagrama de Venn 
podría ayudar). 

a. P(B | A) b. P(B' | A) 

c. P(A\B) d.P(A'\B) 

e. Dado que el individuo seleccionado tiene por lo menos 
una tarjeta, ¿cuál es la probabilidad de que él o ella ten¬ 
ga una tarjeta Visa? 

48. Reconsidere la situación del sistema defectuoso descrito en 
el ejercicio 26 (sección 2.2). 

a. Dado que el sistema tiene un defecto de tipo 1, ¿cuál es 
la probabilidad de que tenga un defecto de tipo 2? 

b. Dado que el sistema tiene un defecto de tipo 1, ¿cuál es 
la probabilidad de que tenga los tres tipos de defectos? 

c. Dado que el sistema tiene por lo menos un tipo de defec¬ 
to, ¿cuál es la probabilidad de que tenga exactamente un 
tipo de defecto? 


d. Dado que el sistema tiene los primeros dos tipos de 
defectos, ¿cuál es la probabilidad de que no tenga el ter¬ 
cer tipo de defecto? 

49. Si se seleccionan al azar dos focos de la caja descrita en el 
ejercicio 38 (sección 2.3) y por lo menos uno de ellos es de 
75 W, ¿cuál es la probabilidad de que los dos sean de 75 W? 
Dado que por lo menos uno de los dos seleccionados no es 
de 75 W, ¿cuál es la probabilidad de que los dos focos se¬ 
leccionados sean de la misma clase? 

50. Una tienda de departamentos vende camisas sport en tres 
tallas (chica, mediana y grande), tres diseños (a cuadros, es¬ 
tampadas y a rayas) y dos largos de manga (larga y corta). 
Las tablas adjuntas dan las proporciones de camisas vendi¬ 
das en las combinaciones de categoría. 


Manga corta 




Diseño 


Talla 

Cuadros 

Estampada 

Rayas 

CH 

0.04 

0.02 

0.05 

M 

0.08 

0.07 

0.12 

G 

0.03 

0.07 

0.08 

Manga larga 



Diseño 


Talla 

Cuadros 

Estampada 

Rayas 

CH 

0.03 

0.02 

0.03 

M 

0.10 

0.05 

0.07 

G 

0.04 

0.02 

0.08 


a. ¿Cuál es la probabilidad de que la siguiente camisa ven¬ 
dida sea una camisa mediana estampada de manga larga? 

b. ¿Cuál es la probabilidad de que la siguiente camisa ven¬ 
dida sea una camisa estampada mediana? 

c. ¿Cuál es la probabilidad de que la siguiente camisa ven¬ 
dida sea de manga corta? ¿De manga larga? 

d. ¿Cuál es la probabilidad de que la talla de la siguiente 
camisa vendida sea mediana? ¿Que la siguiente camisa 
vendida sea estampada? 

e. Dado que la camisa que se acaba de vender era de man¬ 
ga corta a cuadros, ¿cuál es la probabilidad de que fuera 
mediana? 

f. Dado que la camisa que se acaba de vender era mediana 
a cuadros, ¿cuál es la probabilidad de que fuera de man¬ 
ga corta? ¿De manga larga? 
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51. Una caja contiene seis pelotas rojas y cuatro verdes y una se¬ 
gunda caja contiene siete pelotas rojas y tres verdes. Se selec¬ 
ciona una pelota al azar de la primera caja y se le coloca en 
la segunda caja. Luego se selecciona al azar una pelota de la 
segunda caja y se le coloca en la primera caja. 

a. ¿Cuál es la probabilidad de que se seleccione una pelo¬ 
ta roja de la primera caja y de que se seleccione una pe¬ 
lota roja de la segunda caja? 

b. Al final del proceso de selección, ¿cuál es la probabilidad 
de que los números de pelotas rojas y verdes que hay en 
la primera caja sean idénticas a los números iniciales? 

52. Un sistema se compone de bombas idénticas, #1 y #2. Si 
una falla, el sistema seguirá operando. Sin embargo, debido 
al esfuerzo adicional, ahora es más probable que la bom¬ 
ba restante falle de lo que era originalmente. Es decir, 
r = P(# 2 falla | #1 falla) > P(# 2 falla) = q. Si por lo menos 
una bomba falla alrededor del final de su vida útil en 7% de 
todos los sistemas y ambas bombas fallan durante dicho pe¬ 
riodo en sólo 1%, ¿cuál es la probabilidad de que la bomba 
#1 falle durante su vida útil de diseño? 

53. Un taller repara tanto componentes de audio como de vi¬ 
deo. Sea A el evento en que el siguiente componente traído 
a reparación es un componente de audio y sea B el evento 
en que el siguiente componente es un reproductor de discos 
compactos (así que el evento B está contenido en A). Su¬ 
ponga que P(A) = 0.6 y P(B) = 0.05. ¿Cuál es P(B \ A)? 

54. En el ejercicio 13, A, = {proyecto otorgado i}, con i = 1, 2, 3. 
Use las probabilidades dadas allí para calcular las siguien¬ 
tes probabilidades y explique en palabras el significado de 
cada una. 

a. P(A 2 |Aj) b. P(A 2 Cl A 3 1 Aj) c. P(A 2 U A 3 |Aj) 
d. P(Aj n A 2 n A 3 1 A! U A 2 U A 3 ). 

55. Las garrapatas de venados pueden ser portadoras de la en¬ 
fermedad de Lyme o de la Erhlichiosis granulocítica huma¬ 
na (HGE, por sus siglas en inglés). Con base en un estudio 
reciente, suponga que 16% de todas las garrapatas en cierto 
lugar portan la enfermedad de Lyme, 10% portan HGE y 
10% de las garrapatas que portan por lo menos una de estas 
enfermedades en realidad portan las dos. Si determina que 
una garrapata seleccionada al azar ha sido portadora de 
HGE, ¿cuál es la probabilidad de que la garrapata seleccio¬ 
nada también porte la enfermedad de Lyme? 

56. Para los eventos AyB con P{B) > 0, demuestre que P{A \ B ) 
+ P(A' | B) = 1. 

57. Si P(B | A) > P(B), demuestre que P(B'\A) < P(B'). [ Suge¬ 
rencia: Sume P{B' | A) a ambos lados de la desigualdad da¬ 
da y luego utilice el resultado del ejercicio 56.] 

58. Demuestre que para tres eventos cualesquiera A, B y C con 
P(C) >0,P(A U B\ C) = P(A I C) + P(B | C)-P(A Cl B \ C). 

59. En una gasolinería, 40% de los clientes utilizan gasolina re¬ 
gular (Aj), 35% usan gasolina plus (A 2 ) y 25% utilizan pre- 
mium (A 3 ). De los clientes que utilizan gasolina regular, sólo 
30% llenan sus tanques (evento B). De los clientes que utili¬ 
zan plus, 60% llenan sus tanques, mientras que los que uti¬ 
lizan premium, 50% llenan sus tanques. 

a. ¿Cuál es la probabilidad de que el siguiente cliente pida 
gasolina plus y llene el tanque (A ? Cl 5)? 

b. ¿Cuál es la probabilidad de que el siguiente cliente lle¬ 
ne el tanque? 
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c. Si el siguiente cliente llena el tanque, ¿cuál es la proba¬ 
bilidad que pida gasolina regular? ¿Plus? ¿Premium? 

60. El 70% de las aeronaves ligeras que desaparecen en vuelo 
en cierto país son posteriormente localizadas. De las aero¬ 
naves que son localizadas, 60% cuentan con un localizador 
de emergencia, mientras que 90% de las aeronaves no locali¬ 
zadas no cuentan con dicho localizador. Suponga que una 
aeronave ligera ha desaparecido. 

a. Si tiene un localizador de emergencia, ¿cuál es la proba¬ 
bilidad de que no sea localizada? 

b. Si no tiene un localizador de emergencia, ¿cuál es la 
probabilidad de que sea localizada? 

61. Componentes de cierto tipo son enviados a un distribuidor en 
lotes de diez. Suponga que 50% de dichos lotes no contie¬ 
nen componentes defectuosos, 30% contienen un componente 
defectuoso y 20% contienen dos componentes defectuosos. 
Se seleccionan al azar dos componentes de un lote y se 
prueban. ¿Cuáles son las probabilidades asociadas con 0, 1 
y 2 componentes defectuosos que están en el lote en cada 
una de las siguientes condiciones? 

a. Ningún componente probado está defectuoso. 

b. Uno de los dos componentes probados está defectuoso. 
[Sugerencia : Trace un diagrama de árbol con tres ramas 
de primera generación correspondientes a los tres tipos 
diferentes de lotes.] 

62. Una compañía que fabrica cámaras de video produce un mo¬ 
delo básico y un modelo de lujo. Durante el año pasado, 
40% de las cámaras vendidas fueron del modelo básico. De 
aquellos que compraron el modelo básico, 30% adquirieron 
una garantía ampliada, en tanto que 50% de los que compra¬ 
ron el modelo de lujo también lo hicieron. Si sabe que un 
comprador seleccionado al azar tiene una garantía ampliada, 
¿qué tan probable es que él o ella tengan un modelo básico? 

63. Para los clientes que compran un refrigerador en una tienda 
de aparatos domésticos, sea A el evento en que el refrigera¬ 
dor fue fabricado en EU, B el evento en que el refrigerador 
contaba con una máquina de hacer hielos y C el evento en 
que el cliente adquirió una garantía ampliada. Las probabi¬ 
lidades pertinentes son 

P(A) = 0.75 P(B | A) = 0.9 P(B | A') = 0.8 
P{C\A ÍT B) = 0.8 P(C\A n B') = 0.6 
P(C\A' n B) = 0.7 P(C\A' ÍT B') — 0.3 

a. Construya un diagrama de árbol compuesto de ramas de 
primera, segunda y tercera generaciones y anote el even¬ 
to y la probabilidad apropiada junto a cada rama. 

b. Calcule P(A IT B Cl C). 

c. Calcule P(B Cl C). 

d. Calcule P(C). 

e. Calcule P(A \ B fl C), la probabilidad de la compra de un 
refrigerador fabricado en EU dado que también se adquirie¬ 
ron una máquina de hacer hielos y una garantía ampliada. 

64. En el ejemplo 2.30, suponga que la tasa de incidencia de la 
enfermedad es de 1 en 25 y no de 1 en 1000. ¿Cuál es en¬ 
tonces la probabilidad de un resultado de prueba positivo? 
Dado que el resultado de prueba es positivo, ¿cuál es la pro¬ 
babilidad de que el individuo tenga la enfermedad? Dado un 
resultado de prueba negativo, ¿cuál es la probabilidad de 
que el individuo no tenga la enfermedad? 
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65. En una gran universidad, en la búsqueda que nunca termina 
de un libro de texto satisfactorio, el Departamento de Estadís¬ 
tica probó un texto diferente durante cada uno de los últimos 
tres trimestres. Durante el trimestre de otoño, 500 estudiantes 
utilizaron el texto del profesor Mean; durante el trimestre de 
invierno, 300 estudiantes usaron el texto del profesor Median 
y durante el trimestre de primavera, 200 estudiantes utiliza¬ 
ron el texto del profesor Mode. Una encuesta realizada al fi¬ 
nal de cada trimestre mostró que 200 estudiantes se sintieron 
satisfechos con el libro de Mean, 150 con el libro de Median 
y 160 con el libro de Mode. Si se selecciona al azar un estu¬ 
diante que cursó estadística durante uno de estos trimestres y 
admite haber estado satisfecho con el texto, ¿es probable que 
el estudiante haya utilizado el libro de Mean, Median o Mo¬ 
de? ¿Quién es el autor menos probable? [Sugerencia: Trace 
un diagrama de árbol o use el teorema de Bayes.] 

66. Considere la siguiente información sobre vacacionistas (ba¬ 
sada en parte en una encuesta reciente de Travelocity): 40% 
revisan su correo electrónico de trabajo, 30% utilizan un te¬ 
léfono celular para permanecer en contacto con su trabajo, 
25% trajeron una computadora portátil consigo, 23% revisan 
su correo electrónico de trabajo y utilizan un teléfono celular 
para permanecer en contacto y 51% ni revisan su correo elec¬ 
trónico de trabajo ni utilizan un teléfono celular para per¬ 
manecer en contacto ni trajeron consigo una computadora 
portátil. Además, 88 de cada 100 que traen una computado¬ 
ra portátil también revisan su correo electrónico de trabajo y 
70 de cada 100 que utilizan un teléfono celular para perma¬ 
necer en contacto también traen una computadora portátil. 

a. ¿Cuál es la probabilidad de que un vacacionista selec¬ 
cionado al azar que revisa su correo electrónico de tra¬ 
bajo también utilice un teléfono celular para permanecer 
en contacto. 

b. ¿Cuál es la probabilidad de que alguien que trae una 
computadora portátil también utilice un teléfono celular 
para permanecer en contacto. 

c. Si el vacacionista seleccionado al azar revisó su correo 
electrónico de trabajo y trajo una computadora portátil, 
¿cuál es la probabilidad de que él o ella utilice un telé¬ 
fono celular para permanecer en contacto? 

67. Ha habido una gran controversia durante los últimos años 
con respecto a qué tipos de vigilancia son apropiados para 
impedir el terrorismo. Suponga que un sistema de vigilancia 
particular tiene 99% de probabilidades de identificar correc¬ 
tamente a un futuro terrorista y 99.9% de probabilidades de 
identificar correctamente a alguien que no es un futuro terro¬ 
rista. Si existen 1000 futuros terroristas en una población de 
300 millones y se selecciona al azar uno de estos 300 millones. 


examinado por el sistema e identificado como futuro terro¬ 
rista, ¿cuál es la probabilidad de él o ella que sean futuros te¬ 
rroristas? ¿Le inquieta el valor de esta probabilidad sobre el 
uso del sistema de vigilancia? Explique. 

68. Una amiga que vive en Los Ángeles hace viajes frecuentes 
de consultoría a Washington, D.C.; 50% del tiempo viaja en 
la línea aérea #1, 30% del tiempo en la aerolínea #2 y el 
20% restante en la aerolínea #3. Los vuelos de la aerolínea 
#1 llegan demorados a D.C. 30% del tiempo y 10% del 
tiempo llegan demorados a L.A. Para la aerolínea #2, estos 
porcentajes son 25% y 20%, en tanto que para la aerolínea 
#3 los porcentajes son 40% y 25%. Si se sabe que en un via¬ 
je particular ella llegó demorada a exactamente uno de los 
destinos, ¿cuáles son las probabilidades posteriores de haber 
volado en las aerolíneas #1, #2 y #3? Suponga que la proba¬ 
bilidad de arribar con demora a L.A. no se ve afectada por lo 
que suceda en el vuelo a D.C. [ Sugerencia: Desde la punta de 
cada rama de primera generación en un diagrama de árbol, 
trace tres ramas de segunda generación identificadas, respec¬ 
tivamente, como, 0 demorado, 1 demorado y 2 demorado.] 

69. En el ejercicio 59, considere la siguiente información adi¬ 
cional sobre el uso de tarjetas de crédito: 

El 70% de todos los clientes que utilizan gasolina regular y 
que llenan el tanque usan una tarjeta de crédito. 

El 50% de todos los clientes que utilizan gasolina regular 
y que no llenan el tanque usan una tarjeta de crédito. 

El 60% de todos los clientes que llenan el tanque con gaso¬ 
lina plus usan una tarjeta de crédito. 

El 50% de todos los clientes que utilizan gasolina plus y 
que no llenan el tanque usan una tarjeta de crédito. 

El 50% de todos los clientes que utilizan gasolina premium 
y que llenan el tanque usan una tarjeta de crédito. 

El 40% de todos los clientes que utilizan gasolina premium y 
que no llenan el tanque usan una tarjeta de crédito. 

Calcule la probabilidad de cada uno de los siguientes even¬ 
tos para el siguiente cliente que llegue (un diagrama de ár¬ 
bol podría ayudar). 

a. {Plus, tanque lleno y tarjeta de crédito) 

b. {Premium, tanque no lleno y tarjeta de crédito] 

c. {Premium y tarjeta de crédito) 

d. {Tanque lleno y tarjeta de crédito] 

e. {Tarjeta de crédito] 

f. Si el siguiente cliente utiliza una tarjeta de crédito, ¿cuál 
es la probabilidad de que pida premium? 


2.5 Independencia 


La definición de probabilidad condicional permite revisar la probabilidad P(A) originalmente 
asignada a A cuando después se informa que otro evento B ha ocurrido; la nueva probabilidad 
de A es P{A \ B ). En los ejemplos, con frecuencia fue el caso de que P{A | B) difería de la pro¬ 
babilidad no condicional PÍA), lo que indica que la información “B ha ocurrido” cambia la 
probabilidad de que ocurra A. A menudo la probabilidad de que ocurra o haya ocurrido A no se 
ve afectada por el conocimiento de que B ha ocurrido, así que P(A \ B) = P(A). Es entonces 
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natural considerar aAyB como eventos independientes, es decir que la ocurrencia o no ocu¬ 
rrencia de un evento no afecta la probabilidad de que el otro ocurra. 



DEFINICIÓN 


Los eventos Ay B son independientes si P(A \ B) = PÍA) y son dependientes de lo 
contrario. 


La definición de independencia podría parecer “no simétrica” porque no demanda 
también que P(B | A) = P(B). Sin embargo, utilizando la definición de probabilidad condi¬ 
cional y la regla de multiplicación, 

PjA n B ) = P(A | B)P(B) 

P(A) P(A) C J 

El lado derecho de la ecuación (2.7) es P{B) si y sólo si P(A \ B) = P{A) (independen¬ 
cia), así que la igualdad en la definición implica la otra igualdad (y viceversa). También es 
fácil demostrar que si A y B son independientes, entonces también lo son los pares de even¬ 
tos: (1) A' y B, (2) AyB'y (3) A' y B'. 

Ejemplo 2.31 Considere una gasolinería con seis bombas numeradas 1, 2, ..., 6 y sea E¡ el evento simple en 
que un cliente seleccionado al azar utiliza la bomba i (i = 1, . . . , 6). Suponga que P^E^ = 
P(E 6 ) = 0.10, P(E 2 ) = P(E 5 ) = 0.15 y P(E : ) = P(E 4 ) = 0.25. Defina los eventos A, B, C 
como A = {2, 4, 6 },B = { 1, 2, 3} y C = {2, 3, 4, 5}. Luego se tiene P(A) = 0.50, P(A \ B ) = 
0.30 y P{A | C) = 0.50. Es decir, los eventos Ay B son dependientes, en tanto que los eventos 
Ay C son independientes. Intuitivamente, Ay C son independientes porque la división de pro¬ 
babilidad relativa entre las bombas pares e impares es la misma entre las bombas 2, 3, 4, 5 
como lo es entre todas las seis bombas. ■ 

Ejemplo 2.32 Sean Ay B dos eventos excluyentes cualesquiera con P(A) > 0. Por ejemplo, para un auto¬ 
móvil seleccionado al azar, sea A = {el carro es de cuatro cilindros} y B = {el carro es de 
seis cilindros}. Como los eventos son mutuamente excluyentes, si B ocurre, entonces A quizá 
no puede haber ocurrido, así que P(A \ B) = 0 ^ P(A). El mensaje aquí es que si dos eventos 
son mutuamente excluyentes, no pueden ser independientes. Cuando Ay B son mutuamen¬ 
te excluyentes, la información de que A ocurrió dice algo sobre B (no puede haber ocurri¬ 
do), así que se impide la independencia. ■ 

Regla de multiplicación para P{A n B) 

Con frecuencia la naturaleza de un experimento sugiere que dos eventos Ay B deben su¬ 
ponerse independientes. Este es el caso, por ejemplo, si un fabricante recibe una tarjeta de 
circuito de cada uno de dos proveedores diferentes, cada tarjeta se somete a prueba al llegar 
y A = {la primera está defectuosa ¡y B = {la segunda está defectuosa}. Si P(A) = 0.1, tam¬ 
bién deberá ser el caso de que P(A \ B) = 0.1; sabiendo que la condición de la segunda tar¬ 
jeta no informa sobre la condición de la primera. El siguiente resultado muestra cómo 
calcular P(A IT B) cuando los eventos son independientes. 


P{B\A) 



Ay B son independientes si y sólo si 


P(A D B) = P(A ) • P(B) 

(2.8) 


PROPOSICIÓN 
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Parafraseando la proposición, Ay B son independientes si y sólo si la probabilidad de 
que ambos ocurran (A fl B ) es el producto de las dos probabilidades individuales. La veri¬ 
ficación es como sigue: 

P(A n B) = P(A | B) • P(B) = P(A) • P{B) (2.9) 

donde la segunda igualdad en la ecuación (2.9) es válida si y sólo si A y B son independien¬ 
tes. Debido a la equivalencia de independencia con la ecuación (2.8), la segunda puede ser 
utilizada como definición de independencia. 

Ejemplo 2.33 Se sabe que 30% de las lavadoras de cierta compañía requieren servicio mientras se encuen¬ 
tran dentro de garantía, en tanto que sólo 10% de sus secadoras necesitan dicho servicio. Si 
alguien adquiere tanto una lavadora como una secadora fabricadas por esta compañía, ¿cuál 
es la probabilidad de que ambas máquinas requieran servicio de garantía? 

Sea A el evento en que la lavadora necesita servicio mientras se encuentra dentro de 
garantía y defina B de forma análoga para la secadora. Entonces P(A) = 0.30 y P(B) = 0.10. 
Suponiendo que las dos máquinas funcionan independientemente una de otra, la probabili¬ 
dad deseada es 

P(A fí B) = P{A ) • P(B) = (0.30X0.10) = 0.03 ■ 

Es fácil demostrar que Ay B son independientes si y sólo si A' y B son independientes, A y 
B' son independientes y A' y B' son independientes. Por lo tanto, en el ejemplo 2.33, la pro¬ 
babilidad de que ninguna máquina necesite servicio es 

P(A' n B') = P(A') • P(B') = (0.70)(0.90) = 0.63 

Ejemplo 2.34 Cada día, de lunes a viernes, un lote de componentes enviado por un primer proveedor arri¬ 
ba a una instalación de inspección. Dos días a la semana, también arriba un lote de un se¬ 
gundo proveedor. El 80% de todos los lotes del proveedor 1 son inspeccionados y 90% de 
los del proveedor 2 también lo son. ¿Cuál es la probabilidad de que, en un día seleccionado 
al azar, dos lotes sean inspeccionados? Esta pregunta se responderá suponiendo que en los 
días en que se inspeccionan dos lotes, si el primer lote pasa es independiente de si el segun¬ 
do también lo hace. La figura 2.13 muestra la información pertinente. 




0.4 X (0.8 X 0.9) 


Figura 2.13 Diagrama de árbol para el ejemplo 2.34. 


Pidos pasan) = Pidos recibidos Cl ambos pasan) 

= P(ambos pasan | dos recibidos) ■ P(dos recibidos) 

= [(0.8)(0.9)(0.4) = 0.288 ■ 
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DEFINICIÓN 


Ejemplo 2.35 


e 
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Independencia de más de dos eventos 

La noción de independencia de dos eventos puede ser ampliada a conjuntos de más de dos 
eventos. Aunque es posible ampliar la definición para dos eventos independientes trabajan¬ 
do en función de probabilidades condicionales y no condicionales, es más directo y menos 
tedioso seguir las líneas de la última proposición. 


Los eventos A { , ... , A n son mutuamente independientes si por cada k (k = 2, 
3, . . . , n) y cada subconjunto de índices ¡j, i 2 , . . . , i k , 

P{\ n a , 2 n • • • n aq = P(A ¿i ) • p(a ¡2 ) . píaq. 


Parafraseando la definición, los eventos son mutuamente independientes si la probabili¬ 
dad de la intersección de cualquier subconjunto de “«"-elementos, es igual al producto de las 
probabilidades individuales. Al utilizar la propiedad de multiplicación para más de dos eventos 
independientes, es legítimo reemplazar una o más de las A/ por su complemento (p. ej., si 
A 2 y A 3 son eventos independientes, también lo son A ¡, A' 2 y A 3 ). Como fue el caso con dos even¬ 
tos, con frecuencia se especifica al principio de un problema la independencia de ciertos 
eventos. La probabilidad de una intersección puede entonces ser calculada vía multiplicación. 

El artículo “Reliability Evaluation of Solar Photovoltaic Arrays” (Solar Energy , 2002: 
129-141) presenta varias configuraciones de redes fotovoltaicas solares compuestas de celdas 
solares de silicio cristalino. Considérese primero el sistema ilustrado en la figura 2.14(a). 



(a) (b) 


Figura 2.14 Configuración del sistema para el ejemplo 2.35: (a) en serie-paralelo; 

(b) vinculado en cruz total. 

Existen dos subsistemas conectados en paralelo y cada uno contiene tres celdas. Para que el 
sistema funcione, por lo menos uno de los dos subsistemas en paralelo debe funcionar. Den¬ 
tro de cada subsistema, las tres celdas están conectadas en serie, así que un subsistema fun¬ 
cionará sólo si todas sus celdas funcionan. Considere un valor de duración particular t 0 y 
suponga que desea determinar la probabilidad de que la duración del sistema exceda de t 0 . 
Sea A, el evento en que la duración de la celda i excede deí 0 (i = 1,2,..., 6). Se supone 
que las A, son eventos independientes (ya sea que cualquier celda particular que dure más 
de t {] horas no tenga ningún efecto en sí o no cualquier otra celda lo hace) y que P(A¡) = 0.9 
por cada i puesto que las celdas son idénticas. Entonces 

LO a duración del 

sistema excede de f 0 ) = PKA! Cl A 2 fl A 3 ) U (A 4 D A 5 Cl A 6 )] 

= P(A 1 n a 2 n a 3 ) + p(a 4 n a 5 n a 6 ) 

- p [(A! n a 2 n A 3 ) n (a 4 n a 5 n a 6 )] 

= (0.9)(0.9)(0.9) + (0.9)(0.9)(0.9) - (0.9)(0.9)(0.9)(0.9)(0.9)(0.9) = 0.927 

Alternativamente, 

/Ala duración del sistema excede de f 0 ) = 1 — /Aambas duraciones del subsistema son < r 0 ) 

= 1 — [P(la duración del subsistema es < í 0 )] 2 
= 1 — [1 — /Ala duración del subsistema es > / 0 )] 2 
= 1 - [1 - (0.9 ) 3 ] 2 = 0.927 
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CAPITULO 2 


Probabilidad 


Considérese a continuación el sistema vinculado en cruz mostrado en la figura 2.14(b), ob¬ 
tenido a partir de la red conectada en serie-paralelo mediante la conexión de enlaces a tra¬ 
vés de cada columna de uniones. Ahora bien, el sistema falla en cuanto toda una columna 
falla y la duración del sistema excede de t 0 sólo si la duración de cada columna lo hace. Pa¬ 
ra esta configuración, 

P (la duración del sistema 

es de por lo menos f 0 ) = [/Yla duración de la columna excede de f 0 )] 3 
= [1 — P(duración de la columna < ? 0 )] 3 

= [1 — /Ala duración de ambas celdas en una columna es < f 0 )] 3 
= [1 — (1 — 0.9) 2 ] 3 = 0.970 ■ 


EJERCICIOS Sección 2.5 (70-89) 


70. Reconsidere el escenario de la tarjeta de crédito del ejercicio 
47 (sección 2.4) y demuestre que A y B son dependientes uti¬ 
lizando primero la definición de independencia y luego ve¬ 
rificando que la propiedad de multiplicación no prevalece. 

71. Una compañía de exploración petrolera en la actualidad tie¬ 
ne dos proyectos activos, uno en Asia y el otro en Europa. Sea 
A el evento en que el proyecto asiático tiene éxito y B el even¬ 
to en que el proyecto europeo tiene éxito. Suponga que Ay B 
son eventos independientes con P(A) = 0.4 y P(B) = 0.7. 

a. Si el proyecto asiático no tiene éxito, ¿cuál es la proba¬ 
bilidad de que el europeo también fracase? Explique su 
razonamiento. 

b. ¿Cuál es la probabilidad de que por lo menos uno de los 
dos proyectos tenga éxito? 

c. Dado que por lo menos uno de los dos proyectos tiene 
éxito, ¿cuál es la probabilidad de que sólo el proyecto 
asiático tenga éxito? 

72. En el ejercicio 13, ¿es cualquier A¡ independiente de cual¬ 
quier otro Ap Responda utilizando la propiedad de multipli¬ 
cación para eventos independientes. 

73. Si A y B son eventos independientes, demuestre que A' y B 
también son independientes. [Sugerencia: Primero establez¬ 
ca una relación entre P{A' fl B), P(B) y P(A fl 6).] 

74. Suponga que las proporciones de fenotipos sanguíneos en 
una población son las siguientes: 

A B AB O 

0.42 0.10 0.04 0.44 

Suponiendo que los fenotipos de dos individuos selecciona¬ 
dos al azar son independientes uno de otro, ¿cuál es la pro¬ 
babilidad de que ambos fenotipos sean O? ¿Cuál es la 
probabilidad de que los fenotipos de dos individuos selec¬ 
cionados al azar coincidan? 

75. Una de las suposiciones que sustentan la teoría de las gráfi¬ 
cas de control (véase el capítulo 16) es que los puntos dibu¬ 
jados consecutivamente son independientes entre sí. Cada 
punto puede señalar que un proceso de producción está fun¬ 
cionando correctamente o que existe algún funcionamiento 
defectuoso. Aun cuando un proceso esté funcionando de 


manera correcta, existe una pequeña probabilidad de que un 
punto particular señalará un problema con el proceso. Supon¬ 
ga que esta probabilidad es de 0.05. ¿Cuál es la probabilidad 
de que por lo menos uno de 10 puntos sucesivos indique un 
problema cuando de hecho el proceso está operando correc¬ 
tamente? Responda está pregunta para 25 puntos sucesivos. 

76. La probabilidad de que un calificador se equivoque al mar¬ 
car cualquier pregunta particular de un examen de opciones 
múltiples es de 0.1. Si existen diez preguntas y éstas se mar¬ 
can en forma independiente, ¿cuál es la probabilidad de que 
no se cometan errores? ¿Que por lo menos se cometa un 
error? Si existen n preguntas y la probabilidad de un error 
de marcado es p en lugar de 0.1, dé expresiones para estas 
dos probabilidades. 

77. La costura de un avión requiere 25 remaches. La costura 
tendrá que ser retrabajada si alguno de los remaches está 
defectuoso. Suponga que los remaches están defectuosos 
independientemente uno de otro, cada uno con la misma 
probabilidad. 

a. Si 20% de todas las costuras tienen que ser retrabajadas, 
¿cuál es la probabilidad de que un remache esté defec¬ 
tuoso? 

b. ¿Qué tan pequeña deberá ser la probabilidad de un re¬ 
mache defectuoso para garantizar que sólo 10% de las 
costuras tienen que ser retrabajadas? 

78. Una caldera tiene cinco válvulas de alivio idénticas. La pro¬ 
babilidad de que cualquier válvula particular se abra en un 
momento de demanda es de 0.95. Suponiendo que operan 
independientemente, calcule P(por lo menos una válvula se 
abre) y P(por lo menos una válvula no se abre). 

79. Dos bombas conectadas en paralelo fallan independiente¬ 
mente una de otra en cualquier día dado. La probabilidad de 
que falle sólo la bomba más vieja es de 0.10 y la probabili¬ 
dad de que sólo la bomba más nueva falle es de 0.05. ¿Cuál 
es la probabilidad de que el sistema de bombeo falle en 
cualquier día dado (lo que sucede si ambas bombas fallan)? 

80. Considere el sistema de componentes conectados como en 
la figura adjunta. Los componentes 1 y 2 están conectados 
en paralelo, de modo que el subsistema trabaja si y sólo si 
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1 o 2 trabaja; como 3 y 4 están conectados en serie, qué sub¬ 
sistema trabaja si y sólo si 3 y 4 trabajan. Si los componen¬ 
tes funcionan independientemente uno de otro y P(el 
componente trabaja) = 0.9, calcule P(e 1 sistema trabaja). 



81. Remítase otra vez al sistema en serie-paralelo introducido 
en el ejemplo 2.35 y suponga que existen sólo dos celdas en 
lugar de tres en cada subsistema en paralelo [en la figura 
2.14(a), elimine las celdas 3 y 6 y renumere las celdas 4 y 
5 como 3 y 4], Utilizando P(A¡) = 0.9, es fácil ver que la 
probabilidad de que la duración del sistema exceda de t 0 es 
de 0.9639. ¿A qué valor tendría que cambiar 0.9 para incre¬ 
mentar la duración del sistema de 0.9639 a 0.99? [Sugeren¬ 
cia: Sea P(A¡) — p, exprese la confiabilidad del sistema en 
función de p, luego haga x = p 2 .] 

82. Considere lanzar en forma independiente dos dados impar¬ 
ciales, uno rojo y otro verde. Sea A el evento en que el da¬ 
do rojo muestra 3 puntos, B el evento en que el dado verde 
muestra 4 puntos y C el evento en que el número total de 
puntos que muestran los dos dados es 7. ¿Son estos eventos 
independientes por pares (es decir, ¿son Ay B eventos inde¬ 
pendientes, son Ay C independientes y son B y C indepen¬ 
dientes? ¿Son los tres eventos mutuamente independientes? 

83. Los componentes enviados a un distribuidor son revisados 
en cuanto a defectos por dos inspectores diferentes (cada 
componente es revisado por ambos inspectores). El primero 
detecta 90% de todos los defectuosos que están presentes y 
el segundo hace lo mismo. Por lo menos un inspector no de¬ 
tecta un defecto en 20% de todos los componentes defectuo¬ 
sos. ¿Cuál es la probabilidad de que ocurra lo siguiente? 

a. ¿Un componente defectuoso será detectado sólo por el 
primer inspector? ¿Por exactamente uno de los dos ins¬ 
pectores? 

b. ¿Los tres componentes defectuosos en un lote no son 
detectados por ambos inspectores (suponiendo que las 
inspecciones de los diferentes componentes son inde¬ 
pendientes unas de otras)? 

84. El 70% de todos los vehículos examinados en un centro de ve¬ 
rificación de emisiones pasan la inspección. Suponiendo que 
vehículos sucesivos pasan o fallan independientemente uno de 
otro, calcule las siguientes probabilidades: 

a. P(los tres vehículos siguientes inspeccionados pasan). 

b. Pípor lo menos uno de los tres vehículos siguientes pasa). 

c. /^exactamente uno de los tres vehículos siguientes pasa). 

d. Pfcuando mucho uno de los tres vehículos siguientes 
inspeccionados pasa). 

e. Dado que por lo menos uno de los tres vehículos si¬ 
guientes pasa la inspección, ¿cuál es la probabilidad de 
que los tres pasen (una probabilidad condicional)? 

85. Un inspector de control de calidad verifica artículos recién 
producidos en busca de fallas. El inspector examina un 
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artículo en busca de fallas en una serie de observaciones in¬ 
dependientes, cada una de duración fija. Dado que en reali¬ 
dad está presente una imperfección, sea p la probabilidad de 
que la imperfección sea detectada durante cualquier obser¬ 
vación (este modelo se discute en “Human Performance in 
Sampling Inspection”, Human Factors, 1979: 99-105). 

a. Suponiendo que un artículo tiene una imperfección, ¿cuál 
es la probabilidad de que sea detectada al final de la se¬ 
gunda observación (una vez que una imperfección ha si¬ 
do detectada, la secuencia de observaciones termina)? 

b. Dé una expresión para la probabilidad de que una imper¬ 
fección sea detectada al final de la n-ésima observación. 

c. Si cuando en tres observaciones no ha sido detectada una 
imperfección, el artículo es aprobado, ¿cuál es la probabi¬ 
lidad de que un artículo imperfecto pase la inspección? 

d. Suponga que 10% de todos los artículos contienen una 
imperfección [/^artículo seleccionado al azar muestra 
una imperfección) = 0.1]. Con la suposición del inciso 
c), ¿cuál es la probabilidad de que un artículo seleccio¬ 
nado al azar pase la inspección (pasará automáticamen¬ 
te si no tiene imperfección, pero también podría pasar si 
tiene una imperfección)? 

e. Dado que un artículo ha pasado la inspección (sin imper¬ 
fecciones en tres observaciones), ¿cuál es la probabilidad 
de que sí tenga una imperfección? Calcule para p = 0.5. 

86. a. Una compañía maderera acaba de recibir un lote de 

10 000 tablas de 2 X 4. Suponga que 20% de estas tablas 
(2 000) en realidad están demasiado tiernas o verdes para 
ser utilizadas en construcción de primera calidad. Se eli¬ 
gen dos tablas al azar, una después de la otra. Sea A = 
{la primera tabla está verde] y B = [la segunda tabla es¬ 
tá verde]. Calcule P(A), P(B) y P(A Cl B ) (un diagrama 
de árbol podría ayudar). ¿Son Ay B independientes? 

b. Con Ay B independientes y P(A) = P(B) = 0.2, ¿cuál 
es P(A D B)1 ¿Cuánta diferencia existe entre esta res¬ 
puesta y P(A n B) en el inciso a)? Para propósitos de 
cálculo P(A n B), ¿se puede suponer que Ay B del in¬ 
ciso a) son independientes para obtener en esencia la 
probabilidad correcta? 

c. Suponga que un lote consta de 10 tablas, de las cuales 
dos están verdes. ¿Produce ahora la suposición de inde¬ 
pendencia aproximadamente la respuesta correcta para 
P(A D /?)? ¿Cuál es la diferencia crítica entre la situación 
en este caso y la del inciso a)? ¿Cuándo piensa que una 
suposición de independencia sería válida al obtener 
una respuesta aproximadamente correcta a P(A n 25)? 

87. Remítase a las suposiciones manifestadas en el ejercicio 80 
y responda la pregunta planteada allí para el sistema de la 
figura adjunta. ¿Cómo cambiaría la probabilidad si ésta fue¬ 
ra un subsistema conectado en paralelo al subsistema ilus¬ 
trado en la figura 2.14(a)? 



88. El profesor Stan der Deviation puede tomar una de las rutas 
en el trayecto del trabajo a su casa. En la primera ruta, hay 
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cuatro cruces de ferrocarril. La probabilidad de que sea de¬ 
tenido por un tren en cualquiera de los cruces es 0.1 y los 
trenes operan independientemente en los cuatro cruces. La 
otra ruta es más larga pero sólo hay dos cruces, indepen¬ 
dientes uno de otro, con la misma posibilidad de que sea de¬ 
tenido por un tren al igual que en la primera ruta. En un día 
particular, el profesor Deviation tiene una reunión progra¬ 
mada en casa durante cierto tiempo. Cualquiera ruta que to¬ 
me, calcula que llegará tarde si es detenido por los trenes en 
por lo menos la mitad de los cruces encontrados. 

a. ¿Cuál ruta deberá tomar para reducir al mínimo la pro¬ 
babilidad de llegar tarde a la reunión? 

b. Si lanza al aire una moneda imparcial para decidir que ru¬ 
ta tomar y llega tarde, ¿cuál es la probabilidad de que 
tomó la ruta de los cuatro cruces? 


89. Suponga que se colocan etiquetas idénticas en las dos ore¬ 
jas de un zorro. El zorro es dejado en libertad durante un 
tiempo. Considere los dos eventos C¡ = [se pierde la eti¬ 
queta de la oreja izquierda) yC, = [se pierde la etiqueta de 
la oreja derecha). Sea t r = P{C ¡) = P(C,) y suponga que 
Cj y C 2 son eventos independientes. Derive una expresión 
(que implique tt) para la probabilidad de que exactamente 
una etiqueta se pierda dado que cuando mucho una se pier¬ 
de (“Ear Tag Loss in Red Foxes”, J. Wildlife Mgmt., 1976: 
164-167). [ Sugerencia: Trace un diagrama de árbol en el 
cual las dos ramas iniciales se refieren a si la etiqueta de la 
oreja izquierda se pierde.) 


EJERCICIOS SUPLEMENTARIOS (90-114) 


90. Una pequeña compañía manufacturera iniciará un tumo de no¬ 
che. Hay 20 mecánicos empleados por la compañía. 

a. Si una cuadrilla nocturna se compone de 3 mecánicos, 
¿cuántas cuadrillas diferentes son posibles? 

b. Si los mecánicos están clasificados 1, 2, . . . , 20 en or¬ 
den de competencia, ¿cuántas de estas cuadrillas no in¬ 
cluirían al mejor mecánico? 

c. ¿Cuántas de las cuadrillas tendrían por lo menos 1 de los 
10 mejores mecánicos? 

d. Si se selecciona al azar una de estas cuadrillas para que 
trabajen una noche particular, ¿cuál es la probabilidad 
de que el mejor mecánico no trabaje esa noche? 

91. Una fábrica utiliza tres líneas de producción para fabricar 
latas de cierto tipo. La tabla adjunta da porcentajes de latas 
que no cumplen con las especificaciones, categorizadas por 
tipo de incumplimiento de las especificaciones, para cada 
una de las tres líneas durante un periodo particular. 

Línea 1 Línea 2 Línea 3 


Manchas 

15 

12 

20 

Grietas 

50 

44 

40 

Problema con la argolla 
de apertura 

21 

28 

24 

Defecto superficial 

10 

8 

15 

Otros 

4 

8 

2 


Durante este periodo, la línea 1 produjo 500 latas fuera de 
especificación, la 2 produjo 400 latas como esas y la 3 fue 
responsable de 600 latas fuera de especificación. Suponga 
que se selecciona al azar una de estas 1500 latas. 

a. ¿Cuál es la probabilidad de que la lata la produjo la lí¬ 
nea 1? ¿Cuál es la probabilidad de que la razón del in¬ 
cumplimiento de la especificación es una grieta? 

b. Si la lata seleccionada provino de la línea 1, ¿cuál es la 
probabilidad de que tenía una mancha? 

c. Dado que la lata seleccionada mostró un defecto superfi¬ 
cial, ¿cuál es la probabilidad de que provino de la línea 1 ? 

92. Un empleado de la oficina de inscripciones en una univer¬ 
sidad en este momento tiene diez formas en su escritorio en 
espera de ser procesadas. Seis de éstas son peticiones de ba¬ 
ja y las otras cuatro son solicitudes de sustitución de curso. 


a. Si selecciona al azar seis de estas formas para dárselas a 
un subordinado, ¿cuál es la probabilidad de que sólo uno 
de los dos tipos permanezca en su escritorio? 

b. Suponga que tiene tiempo para procesar sólo cuatro de 
estas formas antes de salir del trabajo. Si estas cuatro se 
seleccionan al azar una por una, ¿cuál es la probabilidad 
de que cada forma subsiguiente sea de un tipo diferente de 
su predecesora? 

93. Un satélite está programado para ser lanzado desde Cabo Ca¬ 
ñaveral en Florida y otro lanzamiento está programado para 
la Base de la Fuerza Aérea Vandenberg en California. Sea A 
el evento en que el lanzamiento en Vandenberg se hace a la 
hora programada y B el evento en que el lanzamiento en Ca¬ 
bo Cañaveral se hace a la hora programada. Si A y B son 
eventos independientes con P(A) > P(B) y P(A U5) = 0.626, 
P(A n B) = 0.144, determine los valores de P(A) y P(B). 

94. Un transmisor envía un mensaje utilizando un código bina¬ 
rio, esto es, una secuencia de ceros y unos. Cada bit trans¬ 
mitido (0 o 1) debe pasar a través de tres relevadores para 
llegar al receptor. En cada relevador, la probabilidad es 0.20 
de que el bit enviado será diferente del bit recibido (una in¬ 
versión). Suponga que los relevadores operan independien¬ 
temente uno de otro. 

Transmisor -» Relevador 1 -» Relevador 2 —» Relevador 3 
-» Receptor 

a. Si el transmisor envía un 1, ¿cuál es la probabilidad de 
que los tres relevadores envíen un 1 ? 

b. Si el transmisor envía un 1, ¿cuál es la probabilidad de 
que el receptor reciba un 1? [ Sugerencia: Los ocho re¬ 
sultados experimentales pueden ser mostrados en un 
diagrama de árbol con tres ramas de generación, una por 
cada relevador.) 

c. Suponga que 70% de todos los bits enviados por el 
transmisor son 1. Si el receptor recibe un 1, ¿cuál es la 
probabilidad de que un 1 fue enviado? 

95. El individuo A tiene un círculo de cinco amigos cercanos 
(B, C, D, E y F). A escuchó cierto rumor originado fuera del 
círculo e invitó a sus cinco amigos a una fiesta para contar¬ 
les el rumor. Para empezar, A escoge a uno de los cinco al 
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azar y se lo cuenta. Dicho individuo escoge entonces 
al azar a uno de los cuatro individuos restantes y repite el 
rumor. Después, de aquellos que ya oyeron el rumor uno se 
lo cuenta a otro nuevo individuo y así hasta que todos oyen 
el rumor. 

a. ¿Cuál es la probabilidad de que el rumor se repita en el 
orden B, C, D, E y F? 

b. ¿Cuál es la probabilidad de que F sea la tercera perso¬ 
na en la reunión a quien se cuenta el rumor? 

c. ¿Cuál es la probabilidad de que F sea la última persona 
en oír el rumor? 

96. Remítase al ejercicio 95. Si en cada etapa la persona que 
actualmente “oyó” el rumor no sabe quién ya lo oyó y se¬ 
lecciona el siguiente receptor al azar de entre todos los cin¬ 
co probables individuos, ¿cuál es la probabilidad de que F 
aún no haya escuchado el rumor después de que el rumor 
haya sido contado diez veces en la reunión? 

97. Un ingeniero químico está interesado en determinar si cierta 
impureza está presente en un producto. Un experimento tie¬ 
ne una probabilidad de 0.80 de detectarla si está presente. La 
probabilidad de no detectarla si está ausente es de 0.90. 
Las probabilidades previas de que la impureza esté presen¬ 
te o ausente son de 0.40 y 0.60, respectivamente. Tres expe¬ 
rimentos distintos producen sólo dos detecciones. ¿Cuál es 
la probabilidad posterior de que la impureza esté presente? 

98. A cada concursante en un programa de preguntas se le pi¬ 
de que especifique una de seis posibles categorías de entre 
las cuales se le hará una pregunta. Suponga P(e 1 concur¬ 
sante escoge la categoría i) = j y concursantes sucesivos 
escogen sus categorías independientemente uno de otro. Si 
participan tres concursantes en cada programa y los tres en 
un programa particular seleccionan diferentes categorías, 
¿cuál es la probabilidad de que exactamente uno seleccio¬ 
ne la categoría 1? 

99. Los sujetadores roscados utilizados en la fabricación de 
aviones son levemente doblados para que queden bien 
apretados y no se aflojen durante vibraciones. Suponga 
que 95% de todos los sujetadores pasan una inspección ini¬ 
cial. De 5% que fallan, 20% están tan seriamente defectuo¬ 
sos que deben ser desechados. Los sujetadores restantes son 
enviados a una operación de redoblado, donde 40% no 
pueden ser recuperados y son desechados. El otro 60% de 
estos sujetadores son corregidos por el proceso de redobla¬ 
do y posteriormente pasan la inspección. 

a. ¿Cuál es la probabilidad de que un sujetador que acaba 
de llegar seleccionado al azar pase la inspección inicial¬ 
mente o después del redoblado? 

b. Dado que un sujetador pasó la inspección, ¿cuál es la 
probabilidad de que apruebe la inspección inicial y de 
que no necesite redoblado? 

100. Un porcentaje de todos los individuos en una población 
son portadores de una enfermedad particular. Una prue¬ 
ba de diagnóstico para esta enfermedad tiene una tasa de 
detección de 90% para portadores y de 5% para no porta¬ 
dores. Suponga que la prueba se aplica independientemen¬ 
te a dos muestras de sangre diferentes del mismo individuo 
seleccionado al azar. 

a. ¿Cuál es la probabilidad de que ambas pruebas den el 
mismo resultado? 
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b. Si ambas pruebas son positivas, ¿cuál es la probabilidad 
de que el individuo seleccionado sea un portador? 

101. Un sistema consta de dos componentes. La probabilidad de 
que el segundo componente funcione de manera satisfacto¬ 
ria durante su duración de diseño es de 0.9, la probabilidad 
de que por lo menos uno de los dos componentes lo haga 
es de 0.96 y la probabilidad de que ambos componentes lo 
hagan es de 0.75. Dado que el primer componente funciona 
de manera satisfactoria durante toda su duración de diseño, 
¿cuál es la probabilidad de que el segundo también lo haga? 

102. Cierta compañía envía 40% de sus paquetes de correspon¬ 
dencia nocturna vía un servicio de correo Express E¡. De 
estos paquetes, 2% llegan después del tiempo de entrega 
garantizado (sea L el evento “entrega demorada”). Si se 
selecciona al azar un registro de correspondencia nocturna 
del archivo de la compañía, ¿cuál es la probabilidad de que 
el paquete se fue vía £j y llegó demorado? 

103. Remítase al ejercicio 102. Suponga que 50% de los paque¬ 
tes nocturnos se envían vía servicio de correo Express E y 
el 10% restante se envía por E 3 . De los paquetes enviados 
vía E 2 , sólo 1% llegan demorados, en tanto que 5% de los 
paquetes manejados por E 3 llegan demorados. 

a. ¿Cuál es la probabilidad de que un paquete selecciona¬ 
do al azar llegue demorado? 

b. Si un paquete seleccionado al azar llegó a tiempo, ¿cuál 
es la probabilidad de que no fue mandado vía £j? 

104. Una compañía utiliza tres líneas de ensamble diferentes: A¡, 
A 2 y A 3 , para fabricar un componente particular. De los fa¬ 
bricados por la línea A v 5% tienen que ser retrabajados para 
corregir un defecto, mientras que 8% de los componentes de 
A 2 tienen que ser retrabajados y 10% de los componentes 
de A 3 tienen que ser retrabajados. Suponga que 50% de to¬ 
dos los componentes los produce la línea A v 30% la línea A 2 
y 20% la línea A 3 . Si un componente seleccionado al azar 
tiene que ser retrabajado, ¿cuál es la probabilidad de que 
provenga de la línea A{! ¿De la línea A 2 ? ¿De la línea A 3 ? 

105. Desechando la posibilidad de cumplir años el 29 de febre¬ 
ro, suponga que es igualmente probable que un individuo 
seleccionado al azar haya nacido en cualquiera de los de¬ 
más 365 días. 

a. Si se seleccionan al azar diez personas, ¿cuál es la pro¬ 
babilidad que tendrán diferentes cumpleaños? ¿De que 
por lo menos dos tengan el mismo cumpleaños? 

b. Si k reemplaza a diez en el inciso a), ¿cuál es la k más 
pequeña para la cual existe por lo menos una probabili¬ 
dad de 50-50 de que dos o más personas tengan el mis¬ 
mo cumpleaños? 

c. Si seleccionan diez personas al azar, ¿cuál es la proba¬ 
bilidad de que por los menos dos tengan el mismo cum¬ 
pleaños o por lo menos dos tengan los mismos tres 
últimos dígitos de sus números del Seguro Social? [No¬ 
ta: El artículo “Methods for Studying Coincidences” (F. 
Mosteller y R Diaconis, J. Amer. Stat. Assoc., 1989: 
853-861) discute problemas de este tipo.] 

106. Un método utilizado para distinguir entre rocas graníticas 
(G) y basálticas ( B ) es examinar una parte del espectro infra¬ 
rrojo de la energía solar reflejada por la superficie de la ro¬ 
ca. Sean R v R y R 3 intensidades espectrales medidas a tres 
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longitudes de onda diferentes, en general, para granito R l < 
R 2 < R 3 , en tanto que para basalto R 3 < R¡< R 2 - Cuando se 
hacen mediciones a distancia (mediante un avión), varios or¬ 
denamientos de R¡ pueden presentarse ya sea que la roca sea 
basalto o granito. Vuelos sobre regiones de composición co¬ 
nocida han arrojado la siguiente información: 



Granito 

Basalto 

R 3 < R 2 < R 3 

60% 

10% 

R 1 < R 3 < R 2 

25% 

20% 

R¡ < R¡ < Ri 

15% 

70% 


Suponga que para una roca seleccionada al azar en cierta 
región /"(granito) = 0.25 y /"(basalto) = 0.75. 

a. Demuestre que /"(granito | R¡ < /?, < R 3 ) > /"(basalto | 
R t < /?, < R 3 ). Si las mediciones dieron R 1 < R 2 < R 3 , 
¿clasificaría la roca como granito o como basalto? 

b. Si las mediciones dieron R r < R¡ < /?,, ¿cómo clasifi¬ 
caría la roca? Responda la misma pregunta para R } < 
R¡ < R 2 . 

c. Con las reglas de clasificación indicadas en los incisos 
a) y b) cuando se seleccione una roca de esta región, 
¿cuál es la probabilidad de una clasificación errónea? 
[Sugerencia: G podría ser clasificada como B o B como 
G y P(B) y P(G) son conocidas.] 

d. Si /"(granito =pen lugar de 0.25, ¿existen valores de p 
(aparte de 1) para los cuales una roca siempre sería cla¬ 
sificada como granito? 

107. A un sujeto se le permite una secuencia de vistazos para de¬ 
tectar un objetivo. Sea G¡ = ¡el objetivo es detectado en el 
vistazo i-ésimo], con p¡ = P(G¡). Suponga que los G¡ son 
eventos independientes y escriba una expresión para la pro¬ 
babilidad de que el objetivo haya sido detectado al final del 
vistazo n-ésimo. [Nota: Este modelo se discute en “Predicting 
Aircraft Detectability”, Human Factors , 1979: 277-291.] 

108. En un juego de béisbol de Ligas menores, el lanzador del 
equipo A lanza un “strike” 50% del tiempo y una bola 50% 
del tiempo; los lanzamientos sucesivos son independientes 
unos de otros y el lanzador nunca golpea a un bateador. Sa¬ 
biendo esto, el “mánager” del equipo B ha instruido al pri¬ 
mer bateador que no le batee a nada. Calcule la probabilidad 
de que: 

a. El bateador reciba base por bolas en el cuarto lanza¬ 
miento. 

b. El bateador reciba base por bolas en el sexto lanza¬ 
miento (por lo que dos de los primeros cinco deben ser 
“strikes”), por medio de un argumento de conteo o un 
diagrama de árbol. 

c. El bateador recibe base por bolas. 

d. El primer bateador en el orden al bat anota mientras no 
hay ningún “out” (suponiendo que cada bateador utili¬ 
za la estrategia de no batearle a nada). 

109. Cuatro ingenieros, A, B, C y D han sido citados para entre¬ 
vistas de trabajo a las 10 A.M., el viernes 13 de enero, en 
Random Sampling, Inc. El gerente de personal ha progra¬ 
mado a los cuatro para las oficinas de entrevistas 1, 2, 3 y 
4, respectivamente. Sin embargo, el secretario del gerente 
no está enterado de esto, por lo que los asigna a las oficinas 


de un modo completamente aleatorio (¡Qué más!) ¿Cuál es 
la probabilidad de que 

a. Los cuatro terminen en las oficinas correctas? 

b. Ninguno de los cuatro termine en la oficina correcta? 

110. Una aerolínea particular opera vuelos a las 10 A.M., de 
Chicago a Nueva York, Atlanta y Los Angeles. Sea A el 
evento en que el vuelo a Nueva York está lleno y defina 
los eventos B y C en forma análoga para los otros dos vuelos. 
Suponga que P(A) = 0.6, /"(/?) = 0.5, P(C) = 0.4 y los tres 
eventos son independientes. ¿Cuál es la probabilidad de que 

a. Los tres vuelos estén llenos? Que por lo menos uno no 
esté lleno? 

b. Sólo el vuelo a Nueva York esté lleno? Que exactamen¬ 
te uno de los tres vuelos esté lleno? 

111. Un gerente de personal va a entrevistar cuatro candidatos 
para un puesto. Estos están clasificados como 1, 2, 3 y 4 en 
orden de preferencia y serán entrevistados en orden aleato¬ 
rio. Sin embargo, al final de cada entrevista, el gerente sa¬ 
brá sólo cómo se compara el candidato actual con los 
candidatos previamente entrevistados. Por ejemplo, el or¬ 
den de entrevista 3, 4, 1, 2 no genera información después de 
la primera entrevista, muestra que el segundo candidato es 
peor que el primero y que el tercero es mejor que los pri¬ 
meros dos. Sin embargo, el orden 3, 4, 2, 1 generaría la 
misma información después de cada una de las primeras 
tres entrevistas. El gerente desea contratar al mejor candi¬ 
dato pero debe tomar una decisión irrevocable de contratar¬ 
lo o no contratarlo después de cada entrevista. Considere la 
siguiente estrategia: Rechazar automáticamente a los pri¬ 
meros í candidatos y luego contratar al primer candidato 
subsiguiente que resulte mejor entre los que ya fueron en¬ 
trevistados (si tal candidato no aparece, el último entrevis¬ 
tado es el contratado). 

Por ejemplo, con .s = 2, el orden 3,4, 1,2 permitiría con¬ 
tratar al mejor, en tanto que el orden 3, 1, 2,4 no. De los cua¬ 
tro posibles valores de s (0, 1, 2 y 3), ¿cuál incrementa al 
máximo a P(el mejor es contratado)? [Sugerencia: los 24 or¬ 
denamientos de entrevista igualmente probables: s = 0 signi¬ 
fica que el primer candidato es automáticamente contratado.] 

112. Considere cuatro eventos independientes A¡, A 2 , A 3 y A 4 y 
sea p¡ = P(A¡) con i = 1, 2, 3, 4. Exprese la probabilidad 
de que por lo menos uno de estos eventos ocurra en fun¬ 
ción de las y haga lo mismo para la probabilidad de que 
por lo menos dos de los eventos ocurran. 

113. Una caja contiene los siguientes cuatro papelitos y cada 
uno tiene exactamente las mismas dimensiones: (1) gana el 
premio 1; (2) gana el premio 2; (3) gana el premio 3; (4) 
ganan los premios 1, 2 y 3. Se selecciona un papelito al 
azar. SeaA¡ = ¡gana el premio 1], A, = ¡gana el premio 
2} y A 3 = ¡gana el premio 3 ¡. Demuestre que Aj y A 2 son 
independientes, que A t y A 3 son independientes y que A 2 y 
A 3 también son independientes (esta es una independencia 
por pares). Sin embargo, demuestre que P(A 1 D A 2 Cl A 3 ) 

/"(A¡) • P(A 2 ) • P(A¡), así que los tres eventos no son mu¬ 
tuamente independientes. 

114. Demuestre que si Aj, A, y A 3 son eventos independientes, 
entonces P(A¡ \ A 2 Cl A¡) = /"(A¡). 
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3 Variables aleatorias 
discretas y distribuciones 
de probabilidad 


INTRODUCCIÓN 

Ya sea que un experimento produzca resultados cualitativos o cuantitativos, los mé¬ 
todos de análisis estadístico requieren enfocarse en ciertos aspectos numéricos de los 
datos (como la proporción muestral x/n, la media x o la desviación estándar s). El 
concepto de variable aleatoria permite pasar de los resultados experimentales a la 
función numérica de los resultados. Existen dos tipos fundamentalmente diferentes 
de variables aleatorias: las variables aleatorias discretas y las variables aleatorias con¬ 
tinuas. En este capítulo, se examinan las propiedades básicas y se discuten los ejem¬ 
plos más importantes de variables discretas. El capítulo 4 se enfoca en las variables 
aleatorias continuas. 
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3.1 Variables aleatorias 


En cualquier experimento, existen numerosas características que pueden ser observadas o 
medidas, pero en la mayoría de los casos un experimentador se enfoca en algún aspecto es¬ 
pecífico o aspectos de una muestra. Por ejemplo, en un estudio de patrones de viaje entre los 
suburbios y la ciudad en un área metropolitana, a cada individuo en una muestra se le 
podría preguntar sobre la distancia que recorre para ir de su casa al trabajo y viceversa y el 
número de personas que lo hacen en el mismo vehículo, pero no sobre su coeficiente inte¬ 
lectual, ingreso, tamaño de su familia y otras características. Por otra parte, un investigador 
puede probar una muestra de componentes y anotar sólo el número de los que han fallado 
dentro de 1000 horas, en lugar de anotar los tiempos de falla individuales. 

En general, cada resultado de un experimento puede ser asociado con un número es¬ 
pecificando una regla de asociación (p. ej., el número entre la muestra de diez componentes 
que no duran 1000 horas o el peso total del equipaje en una muestra de 25 pasajeros de ae¬ 
rolínea). Semejante regla de asociación se llama variable aleatoria, variable porque dife¬ 
rentes valores numéricos son posibles y aleatoria porque el valor observado depende de cuál 
de los posibles resultados experimentales resulte (figura 3.1). 



Figura 3.1 Una variable aleatoria. 


DEFINICIÓN 


Para un espacio muestral dado S de algún experimento, una variable aleatoria (va, o 
rv, por sus siglas en inglés) es cualquier regla que asocia un número con cada resul¬ 
tado en c?. En lenguaje matemático, una variable aleatoria es una función cuyo domi¬ 
nio es el espacio muestral y cuyo rango es el conjunto de números reales. 


Se acostumbra denotar las variables aleatorias con letras mayúsculas, tales como Xy Y, 
que son las de cerca del final del alfabeto. En contraste al uso previo de una letra minúscu¬ 
la, tal como x, para denotar una variable, ahora se utilizarán letras mayúsculas para repre¬ 
sentar algún valor particular de la variable aleatoria correspondiente. La notación X(s) = x 
significa que x es el valor asociado con el resultado ,v por la va X. 

Ejemplo 3.1 Cuando un estudiante intenta entrar a un sistema de tiempo compartido de computadora, o 
todos los puertos están ocupados ( F ), en cuyo caso el estudiante no podrá tener acceso o hay 
por lo menos un puerto libre ( S ), en cuyo caso el estudiante sí podrá tener acceso al siste¬ 
ma. Con c? = {S, F], la va X se define como 

X(S) = 1 X(F) = 0 

La va X indica si (1) o no (2) el estudiante puede entrar al sistema. ■ 

La va X en el ejemplo 3.1 se especificó al poner en lista explícitamente cada elemen¬ 
to de S y el número asociado. Una lista como esa es tediosa si S contiene más de algunos 
cuantos resultados, pero con frecuencia puede ser evitada. 

























CAPITULO 3 Variables aleatorias discretas y distribuciones de probabilidad 


Ejemplo 3.2 


DEFINICIÓN 


Ejemplo 3.3 


Ejemplo 3.4 


Ejemplo 3.5 


Considere el experimento en el cual un número telefónico en cierto código de área es elegi¬ 
do con un marcador de números aleatorio (tales dispositivos los utilizan en forma extensa 
organizaciones encuestadoras) y defina una va 7 como 


Y = 


1 si el número seleccionado no aparece en el directorio 
0 si el número seleccionado sí aparece en el directorio 


Por ejemplo, si 5282966 aparece en el directorio telefónico, entonces 7(5282966) = 0 en 
tanto que 7(7727350) = dice que el número 7727350 no aparece en el directorio telefóni¬ 
co. Una descripción en palabras de esta índole es más económica que una lista completa, 
por lo que se utilizará tal descripción siempre que sea posible. ■ 


En los ejemplos 3.1 y 3.2, los únicos valores posibles de la variable aleatoria fueron 
0 y 1. Tal variable aleatoria se presenta con suficiente frecuencia como para darle un nom¬ 
bre especial, en honor del individuo que la estudió primero. 


Cualquier variable aleatoria cuyos únicos valores posibles son 0 y 1 se llama varia¬ 
ble aleatoria de Bernoulli. 


En ocasiones se deseará definir y estudiar varias variables diferentes del mismo espa¬ 
cio muestral. 

El ejemplo 2.3 describe un experimento en el cual se determinó el número de bombas en 
uso en cada una de dos gasolinerías. Defina las variables aleatorias X, Y y U como 

X = el número total de bombas en uso en las dos gasolinerías. 

7 = la diferencia entre el número de bombas en uso en la gasolinería 1 y el número 
en uso en la gasolinería 2. 

U = el máximo de los números de bombas en uso en las dos gasolinerías. 

Si se realiza este experimento y s = (2, 3) se obtiene entonces X((2, 3)) = 2 + 3 = 5, por 
lo que se dice que el valor observado de X fue x = 5. Asimismo, el valor observado de 7 se¬ 
ría y = 2 — 3 = — 1 y el de U sería u = máx(2, 3) = 3. ■ 

Cada una de las variables aleatorias de los ejemplos 3.1-3.3 puede asumir sólo un nú¬ 
mero finito de posibles valores. Éste no tiene que ser el caso. 

En el ejemplo 2.4, se consideraron experimentos en los cuales se examinaron baterías has¬ 
ta que se obtuvo una buena ( S ). El espacio muestral fue S = { S, FS, FFS, . . .}. Defina una 
variable aleatoria X como 

X = el número de baterías examinadas antes que se termine el experimento. 

En ese caso X(S) = 1, X(FS) = 2, X(FFS) = 3, , X(FFFFFFS) = 7, y así sucesivamen¬ 

te. Cualquier entero positivo es un valor positivo de X, así que el conjunto de valores posi¬ 
bles es infinito. ■ 

Suponga que del mismo modo aleatorio, se selecciona un lugar (latitud y longitud) en los 
Estados Unidos continentales. Defina una variable aleatoria 7 como 

7 = la altura sobre el nivel del mar en el lugar seleccionado. 

Por ejemplo, si el lugar seleccionado fuera (39° 50'N, 98° 35'O, entonces se podría tener 
7((39° 50'N, 98° 35'0)) = 1748.26 pies. El valor más grande posible de 7 es 14 494 
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(Monte Whitney) y el valor más pequeño posible es —282 (Valle de la Muerte). El conjun¬ 
to de todos los valores posibles de Y es el conjunto de todos los números en el intervalo en¬ 
tre — 282 y 14 494, es decir, 

{y: y es un número, —282 < y < 14 494} 

y existe un número infinito de números en este intervalo. ■ 


Dos tipos de variables aleatorias 

En la sección 1.2, se distinguió entre los datos que resultan de observaciones de una varia¬ 
ble de conteo y los datos obtenidos observando valores de una variable de medición. Una 
distinción un poco más formal caracteriza dos tipos diferentes de variables aleatorias. 


DEFINICIÓN 


Una variable aleatoria discreta es una variable aleatoria cuyos valores posibles o 
constituyen un conjunto finito o bien pueden ser puestos en lista en una secuencia in¬ 
finita en la cual existe un primer elemento, un segundo elemento, y así sucesivamen¬ 
te (“contablemente” infinita). 

Una variable aleatoria es continua si ambas de las siguientes condiciones aplican: 

1. Su conjunto de valores posibles se compone de o todos los números que hay en un 
solo intervalo sobre la línea de numeración (posiblemente de extensión infinita, es 
decir, desde — °° hasta °°) o todos los números en una unión excluyente de dichos 
intervalos (p. ej., [0, 10] U [20, 30]). 

2. Ningún valor posible de la variable aleatoria tiene probabilidad positiva, esto es, 
P(X = c) = 0 con cualquier valor posible de c. 


Aunque cualquier intervalo sobre la línea de numeración contiene un número infinito de nú¬ 
meros, se puede demostrar que no existe ninguna forma de crear una lista infinita de todos 
estos valores, existen sólo demasiados de ellos. La segunda condición que describe una va¬ 
riable aleatoria continua es tal vez contraintuitiva, puesto que parecería que implica una pro¬ 
babilidad total de cero con todos los valores posibles. Pero en el capítulo 4 se verá que los 
intervalos de valores tienen probabilidad positiva; la probabilidad de un intervalo se reduci¬ 
rá a cero a medida que su ancho tienda a cero. 

Ejemplo 3.6 Todas las variables aleatorias de los ejemplos 3.1-3.4 son discretas. Como otro ejemplo, su¬ 
ponga que se eligen al azar parejas de casados y que a cada persona se le hace una prueba de 
sangre hasta encontrar un esposo y esposa con el mismo factor Rh. Con X = el núme¬ 
ro de pmebas de sangre que serán realizadas, los posibles valores de X son D = [2, 4, 6, 8,...}. 
Como los posibles valores se dieron en secuencia, X es una variable aleatoria discreta. ■ 

Para estudiar las propiedades básicas de las variables aleatorias discretas, sólo se re¬ 
quieren las herramientas de matemáticas discretas: sumas y diferencias. El estudio de varia¬ 
bles continuas requiere las matemáticas continuas del cálculo: integrales y derivadas. 


EJERCICIOS Sección 3.1 (1-10) 


1. Una viga de concreto puede fallar o por esfuerzo cortante (5) 
o flexión ( F ). Suponga que se seleccionan al azar tres vigas 
que fallaron y que se determina el tipo de falla de cada una. 
Sea X = el número de vigas entre las tres seleccionadas que 
fallaron por cortante. Ponga en lista cada resultado en el es¬ 
pacio muestral junto con el valor asociado de X. 

2. Dé tres ejemplos de variables aleatorias de Bernoulli (apar¬ 
te de los que aparecen en el texto). 


3. Con el experimento del ejemplo 3.3, defina dos variables 
aleatorias más y mencione los valores posibles de cada una. 

4. Sea X = el número de dígitos no cero en un código postal 
seleccionado al azar. ¿Cuáles son los posibles valores de XI 
Dé tres posibles resultados y sus valores X asociados. 

5. Si el espacio muestral S es un conjunto infinito, ¿implica es¬ 
to necesariamente que cualquier variable aleatoria X definida 
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a partir de S tendrá un conjunto infinito de posibles valores? 
Si la respuesta es sí, diga por qué. Si es no, dé un ejemplo. 

6. A partir de una hora fija, cada carro que entra a una intersec¬ 
ción es observado para ver si da vuelta a la izquierda (L), la 
derecha ( R ) o si sigue de frente (A). El experimento termina 
en cuanto se observa que un carro da vuelta a la izquierda. 
Sea X = el número de carros observados. ¿Cuáles son los 
posibles valores de XI Dé cinco resultados y sus valores X 
asociados. 

7. Para cada variable definida aquí, describa el conjunto de po¬ 
sibles valores de la variable y diga si la variable es discreta. 

a. X = el número de huevos no quebrados en una caja de 
huevos estándar seleccionada al azar. 

b. Y = el número de estudiantes en una lista de clase de un 
curso particular que no asisten el primer día de clases. 

c. U = el número de veces que un novato tiene que hacerle 
“swing” a una pelota de golf antes de golpearla. 

d. X = la longitud de una serpiente de cascabel selecciona¬ 
da en forma aleatoria. 

e. Z = la cantidad de regalías devengada por la venta de la 
primera edición de 10 000 libros de texto. 

f. Y = el pH de una muestra de suelo elegida al azar. 

g. X = la tensión (lb/pulg 2 ) a la cual una raqueta de tenis se¬ 
leccionada al azar fue encordada. 

h. X = el número total de lanzamientos al aire de una mo¬ 
neda requerido para que tres individuos obtengan una 
coincidencia (HHH o TTT). 

8. Cada vez que un componente se somete a prueba, ésta es un 
éxito (£) o una falla (F). Suponga que el componente 
se prueba repetidamente hasta que ocurre un éxito en tres 
pruebas consecutivas. Sea Y el número de pruebas necesa¬ 
rio para lograrlo. Haga una lista de todos los resultados 
correspondientes a los primeros posibles valores más peque¬ 
ños de y y diga qué valor de Y está asociado con cada uno. 

9. Un individuo de nombre Claudius se encuentra en el punto 0 
del diagrama adjunto. 


a 2 b 2 a 3 





'o 


Aj B 4 A 4 


Con un dispositivo de aleatorización apropiado (tal como un 
dado tetraédrico, uno que tiene cuatro lados), Claudius pri¬ 
mero se mueve a uno de los cuatro lugares fi¡, B 0 , 5 3 , B 4 . 
Una vez que está en uno de estos lugares, se utiliza otro dis¬ 
positivo de aleatorización para decidir si Claudius regresa a 
0 o visita uno de los otros dos lugares adyacentes. Este 
proceso continúa entonces; después de cada movimiento, 
se determina otro movimiento a uno de los (nuevos) pun¬ 
tos adyacentes lanzando al aire un dado o moneda apro¬ 
piada. 

a. Sea X = el número de movimientos que Claudius hace 
antes de regresar a 0. ¿Cuáles son los posibles valores de 
XI ¿Es X discreta o continua? 

b. Si también se permiten movimientos a lo largo de los tra¬ 
yectos diagonales que conectan 0 con A¡, A 2 , A 3 y A 4 , res¬ 
pectivamente, responda la pregunta del inciso a). 

10. Se determinará el número de bombas en uso tanto en la ga- 
solinería de seis bombas como en la gasolinería de cuatro 
bombas. Dé los posibles valores de cada una de las siguien¬ 
tes variables aleatorias: 

a. T = el número total de bombas en uso. 

b. X = la diferencia entre el número en uso en las gasoline- 
rías 1 y 2. 

c. U = el número máximo de bombas en uso en una u otra 
gasolinería. 

d. Z = el número de gasolinerías que tienen exactamente 
dos bombas en uso. 



3.2 Distribuciones de probabilidad 
para variables aleatorias discretas 


Las probabilidades asignadas a varios resultados en S determinan a su vez las probabilidades 
asociadas con los valores de cualquier variable aleatoria X particular. La distribución de pro¬ 
babilidad de X dice cómo está distribuida (asignada) la probabilidad total de 1 entre los va¬ 
rios posibles valores de X. Supóngase, por ejemplo, que una empresa acaba de adquirir cuatro 
impresoras láser y sea X el número entre éstas que requieren servicio durante el periodo de 
garantía. Los posibles valores de X son entonces 0, 1, 2, 3 y 4. La distribución de probabili¬ 
dad dirá cómo está subdividida la probabilidad de 1 entre estos cinco posibles valores: cuán¬ 
ta probabilidad está asociada con el valor 0 de X, cuánta está adjudicada al valor 1 de X, y así 
sucesivamente. Se utilizará la siguiente notación para las probabilidades en la notación: 

p( 0) = la probabilidad del valor 0 de X = P(X = 0) 

p( 1) = la probabilidad del valor 1 de X = P(X =1) 
y así sucesivamente. En general, p(x) denotará la probabilidad asignada al valor de x. 






















c3_p086-129.qxd 


3/12/08 4:01 AM 


Page 91 


Ejemplo 3.7 
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DEFINICIÓN 


Ejemplo 3.8 
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Una cierta gasolinería tiene seis bombas. Sea X el número de bombas que están en servicio 
a una hora particular del día. Suponga que la distribución de probabilidad de X es como se 
da en la tabla siguiente; la primera fila de la tabla contiene los posibles valores de X y la se¬ 
gunda da la probabilidad de dicho valor. 


X 

0 

1 

2 

3 

4 

5 

6 

p(x) 

0.05 

0.10 

0.15 

0.25 

0.20 

0.15 

0.10 


Ahora se pueden usar propiedades de probabilidad elemental para calcular otras probabili¬ 
dades de interés. Por ejemplo, la probabilidad de que cuando mucho dos bombas estén en 
servicio es 

P(X < 2) = P(X = 0 o 1 o 2) = p( 0) + p( 1) + p(2) = 0.05 + 0.10 + 0.15 = 0.30 

Como el evento de que por lo menos 3 bombas estén en servicio es complementario a cuan¬ 
do mucho 2 bombas están en servicio. 

P(X > 3) = 1 - P(X < 2) = 1 - 0.30 = 0.70 

la que, desde luego, también se obtiene sumando las probabilidades de los valores 3, 4, 5 y 6. 
La probabilidad de que entre 2 y 5 bombas inclusive estén en servicio es 

P(2 < A < 5) = P(X = 2, 3, 4 o 5) = 0.15 + 0.25 + 0.20 + 0.15 = 0.75 

en tanto que la probabilidad de que el número de bombas en servicio esté estrictamente en¬ 
tre 2 y 5 es 


P(2 < X < 5) 


P(X = 3 o 4) = 0.25 + 0.20 = 0.45 



La distribución de probabilidad o función masa de probabilidad (fmp) de una va¬ 
riable discreta se define para cada número x como p(x) = PiX = x) = P(todas las 
i£í X(s) = x). 


En palabras, para cada valor posible x de la variable aleatoria, la función masa de pro¬ 
babilidad especifica la probabilidad de observar dicho valor cuando se realiza el experimen¬ 
to. Se requieren las condiciones p(x) > 0 y X todas las x posibles p(x) = 1 de cualquier función 
masa de probabilidad. 

La función masa de probabilidad de X en el ejemplo previo se dio simplemente en la 
descripción del problema. A continuación se consideran varios ejemplos en los cuales va¬ 
rias propiedades de probabilidad son explotadas para obtener la distribución deseada. 

Seis lotes de componentes están listos para ser enviados por un proveedor. El número de 
componentes defectuosos en cada lote es como sigue: 


Lote 1 2 3 4 5 6 

Número de defectuosos 0 2 0 1 2 0 


Uno de estos lotes tiene que ser seleccionado al azar para ser enviado a un cliente particu¬ 
lar. Sea X el número de defectuosos en el lote seleccionado. Los tres posibles valores de X 
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Ejemplo 3.10 


son 0, 1 y 2. De los seis eventos simples igualmente probables, tres dan por resultado 
X = 0, uno X = 1 y los otros dos X = 2. Entonces 

3 

p(0) = P(X = 0) = P(el lote 1 o 3 o 6 es enviado) = — = 0.5 

6 

1 

p(l) = P(X = 1) = P(el lote 4 es enviado) = — = 0.167 

6 

2 

p( 2) = P(X = 2) = P(el lote 2 o 5 es enviado) = — = 0.333 

6 

Es decir, una probabilidad de 0.5 se asigna al valor 0 de X, una probabilidad de 0.167 se 
asigna al valor 1 de X y la probabilidad restante 0.333 se asocia con el valor 2 de X. Los va¬ 
lores de X junto con sus probabilidades especifican la función de masa de probabilidad. Si 
este experimento se repitiera una y otra vez, a la larga X = 0 ocurriría la mitad del tiempo, 
X = 1 un sexto del tiempo y X = 2 un tercio del tiempo. ■ 


Considere si la siguiente persona que compre una computadora en una librería universitaria 
comprará un modelo portátil o uno de escritorio. Sea 


X = 


1 si el cliente compra una computadora portátil 
0 si el cliente compra una computadora de escritorio 


Si 20% de todas las compras durante esa semana seleccionan una portátil, la función 
masa de probabilidad de X es 

p( 0) = P(X = 0) = Piel siguiente cliente compra un modelo de escritorio) = 0.8 
p(\) = P(X = 1) = P(el siguiente cliente compra un modelo portátil) = 0.2 
p(x) = P(X = x) = 0 con v # 0 o 1 

Una descripción equivalente es 


P(x) 


0.8 si x = 0 

0.2 si x = 1 

0 si x ¥= 0 o 1 


La figura 3.2 es una ilustración de esta función masa de probabilidad, llamada gráfica li¬ 
neal. X es, desde luego, una variable aleatoria de Bernoulli y p(x) es una función masa de 
probabilidad de Bernoulli. 


p(x) 

1 


o i 

Figura 3.2 Gráfica lineal de la función de masa de probabilidad en el ejemplo 3.9. 

Considere un grupo de cinco donadores de sangre potenciales, a, b, c, d y e, de los cuales 
sólo a y b tienen sangre tipo 0+. Se determinará en orden aleatorio el tipo de sangre con 
cinco muestras, una de cada individuo hasta que se identifique un individuo 0 + . Sea la 
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variable aleatoria Y = el número de exámenes de sangre para identificar un individuo O+. 
Entonces la función masa de probabilidad de Y es 

2 

p{ 1) = P(Y = 1) = P(a o b examinados primero) = — = 0.4 

p{ 2) = P(Y = 2) = P{c, d o e primero y luego a o b) 

, 3 2 

= P(c, do e primero) • P(a o b a continuación \c,d o e primero) = — • — = 0.3 

p{ 3) = P(Y = 3) = P(c, do e primero y segundo y luego a o b) 



P( 4) = P(Y = 4) = P(c, d y e primero) = íyY^Y jj = O- 1 
p(y) = 0 si y =É 1,2, 3, 4 

En forma tabular, la función de masa de probabilidad es 


y 

i 

2 

3 

4 

p(y) 

0.4 

0.3 

0.2 

0.1 



donde cualquier valor de y que no aparece en la tabla recibe cero probabilidad. La figura 3.3 
muestra una gráfica lineal de la función de masa de probabilidad. 



Figura 3.3 Gráfica lineal de la función de masa de probabilidad en el ejemplo 3.10. 

Un modelo utilizado en física para un sistema de “masas puntuales” sugirió el nom¬ 
bre “función masa de probabilidad”. En este modelo, las masas están distribuidas en varios 
x lugares a lo largo de un eje unidimensional. La función masa de probabilidad describe có¬ 
mo está distribuida la masa de probabilidad total de 1 en varios puntos a lo largo del eje de 
posibles valores de la variable aleatoria (dónde y cuánta masa hay en cada x). 

Otra representación pictórica útil de una función de masa de probabilidad, llamada 
histograma de probabilidad, es similar a los histogramas discutidos en el capítulo 1. So¬ 
bre cada y con p(y ) > 0, se construye un rectángulo con su centro en y. La altura de cada 
rectángulo es proporcional a p(y ) y la base es la misma para todos los rectángulos. Cuando 
los valores posibles están equidistantes, con frecuencia se selecciona la base como la dis¬ 
tancia entre valores y sucesivos (aunque podría ser más pequeña). La figura 3.4 muestra dos 
histogramas de probabilidad. 




a) b) 

Figura 3.4 Histogramas de probabilidad: a) ejemplo 3.9; b) ejemplo 3.10. 
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DEFINICIÓN 


A menudo es útil pensar en una función masa de probabilidad como un modelo matemáti¬ 
co de una población discreta. 

Considere seleccionar al azar un estudiante de entre los 15 000 inscritos en el semestre ac¬ 
tual en la Universidad Mega. Sea X = el número de cursos en los cuales el estudiante selec¬ 
cionado está inscrito y suponga que X tiene la siguiente función masa de probabilidad. 


X 

1 

2 

3 

4 

5 

6 

7 

p(x) 

0.01 

0.03 

0.13 

0.25 

0.39 

0.17 

0.02 


Una forma de ver esta situación es pensar en la población como compuesta de 15 000 
individuos, cada uno con su propio valor X ; la proporción con cada valor de X está dada por 
p(x). Un punto de vista alternativo es olvidarse de los estudiantes y pensar en la población 
como compuesta de los valores X: Existen algunos 1 en la población, algunos 2, ... y final¬ 
mente algunos 7. La población se compone entonces de los números, 1, 2,.. ., 7 (por lo tan¬ 
to es discreta) y p(x) da un modelo para la distribución de los valores de población. ■ 

Una vez que se tiene el modelo de la población, se utilizará para calcular valores de 
características de la población (p. ej., la media p) y para hacer inferencias sobre tales carac¬ 
terísticas. 

Parámetro de una distribución de probabilidad 

En el ejemplo 3.9, se tuvo p( 0) = 0.8 y p( I) = 0.2 porque 20% de todos los compradores 
seleccionaron una computadora portátil. En otra librería, puede ser el caso que p{ 0) = 0.9 
y p{ 1) = 0.1. Más generalmente, la función masa de probabilidad de cualquier variable alea¬ 
toria de Bernoulli puede ser expresada en la forma p(l) = a y p( 0) = 1 — a, donde 
0 < a < 1. Como la función masa de probabilidad depende del valor particular de a, con 
frecuencia se escribe p(x\ a) en lugar de sólo p(x): 

si x = 0 

si x = I (3.1) 

de lo contrario 

Entonces cada opción de a en la expresión (3.1) da una función de masa de probabilidad di¬ 
ferente. 


f 1 — a 

p(x; a) = j a 

i 0 


Supóngase que p(x) depende de la cantidad que puede ser asignada a cualesquiera de 
varios valores posibles y cada valor determina una distribución de probabilidad dife¬ 
rente. Tal cantidad se llama parámetro de distribución. El conjunto de todas las dis¬ 
tribuciones de probabilidad con diferentes valores del parámetro se llama familia de 
distribuciones de probabilidad. 


La cantidad a en la expresión (3.1) es un parámetro. Cada número diferente a entre 
0 y 1 determina un miembro diferente de una familia de distribuciones; dos de esos miem¬ 
bros son 


0.4 

O 

II 

H 

c n 


0.5 

si x = 0 

0.6 

II 

H 

c n 

p(x\ 0.5) = 

0.5 

si x = 1 

0 

de lo contrario 


0 

de lo contrario 


Toda distribución de probabilidad de una variable aleatoria de Bernoulli tiene la forma de la 
expresión (3.1), por lo tanto se llama familia de distribuciones de Bernoulli. 
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Ejemplo 3.12 A partir de un tiempo fijo, se observa el sexo de cada niño recién nacido en un hospital has¬ 
ta que nace un varón ( B ). Sea p = P(B ) y suponga que los nacimientos sucesivos son inde¬ 
pendientes y defina la variable aleatoria X como X = número de nacimientos observados. 
Entonces 

P( 1) = P(X = 1) = P(B) = p 


p{ 2) = P(X = 2) = P(GB) = P(G) ■ P(B) = (1 - p)p 

y 

P( 3) = P(X = 3) = P(GGB) = P(G ) • P(G) • P(B ) = (1 - pfp 
Continuando de esta manera, emerge una fórmula general: 


p(x) 


(1 — pY l p x = 1, 2, 3, . . . 
0 de lo contrario 


(3.2) 


La cantidad p en la expresión (3.2) representa un número entre 0 y 1 y es un parámetro de 
la distribución de probabilidad. En el ejemplo de sexo, p = 0.51 podría ser apropiada, pero 
si se estuviera buscando el primer niño con sangre Rh positivo, entonces se podría tener 
p = 0.85. ■ 


Función de distribución acumulativa 


Para algún valor fijo x, a menudo se desea calcular la probabilidad de que el valor obser¬ 
vado de X será cuando mucho x. Por ejemplo, la función masa de probabilidad en el ejem¬ 
plo 3.8 fue 




' 0-500 x = 0 


p(x) = , 

0.167 x — 1 

y 

0.333 x = 2 



0 de lo contrario 


La probabilidad de que X sea cuando mucho de 1 es entonces 

P(X < 1) = p( 0) + p( 1) = 0.500 + 0.167 = 0.667 


En este ejemplo, X < 1.5 si y sólo si X < 1, por lo tanto 


P(X < 1.5) = P(X < 1) = 0.667 

Asimismo, 

P(X < 0) = P(X = 0) = 0.5, P(X < 0.75) = 0.5 

y de hecho con cualquier x que satisfaga 0 ^ x < 1, P(X < x) = 0.5. El valor X más 
grande posible es 2, por lo tanto 

P(X < 2) = 1, P(X < 3.7) = 1, P(X < 20.5) = 1 

y así sucesivamente. Obsérvese que P(X < 1) < P(X < 1) puesto que la segunda parte 
de la desigualdad incluye la probabilidad del valor 1 de X, en tanto que la primera no. 
Más generalmente, cuando X es discreta y x es un valor posible de la variable, P(X < x) < 
P{X < x). 


DEFINICIÓN 


La función de distribución acumulativa (fda) F(x) de una variable aleatoria discre¬ 
ta X con función masa de probabilidad p(x) se define para cada número x como 

F(x) = P(X<x)= 2 p(y) (3.3) 

y: y-<x 

Para cualquier número x, F(x) es la probabilidad de que el valor observado de X será 
cuando mucho x. 
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Ejemplo 3.13 


Ejemplo 3.14 


La función masa de probabilidad de Y (el número de determinaciones de tipo de sangre) en 
el ejemplo 3.10 fue 


y 

i 

2 

3 

4 

Piy) 

0.4 

0.3 

0.2 

0.1 


Primero se determina F(y) para cada uno de los valores posibles del conjunto (1, 2, 3, 4): 


F(l) = P(Y < 1) = P(Y = 1) = p( 1) = 0.4 

F(2) = P(Y< 2) =P(Y= 1 o 2) = p( 1) + p( 2) = 0.7 

F( 3) = P(Y < 3) = P(Y = 1 o 2 o 3) = p(l) + p( 2) + p( 3) = 0.9 

F( 4) = P(F < 4) = P(L = 1 o 2 o 3 o 4) = 1 

Ahora con cualquier otro número y, F(y) será igual al valor de F con el valor más próximo 
posible de L a la izquierda de y. Por ejemplo, F( 2,7) = P(Y < 2.7) = P(Y < 2) = 0.7 y 
F(3.999) = F(3) = 0.9. La función de distribución acumulativa es por lo tanto 


F(y) 


0 

0.4 

0.7 

0.9 

1 


En la figura 3.5 se muestra una gráfica de 


si y 
si 1 
si 2 
si 3 
si 4 

F(y). 


< 1 

< y < 2 
<y < 3 

< y < 4 

s y 


F(y) 

1 


1 2 3 4 y 

Figura 3.5 Gráfica de la función de distribución acumulativa del ejemplo 3.13. B 

Para una variable aleatoria discreta X, la gráfica de F(x) mostrará un salto con cada 
valor posible de X y será plana entre los valores posibles. Tal gráfica se conoce como fun¬ 
dón escalonada. 


(1 — pY l p x = 1, 2, 3, . . . 
0 de lo contrario 


En el ejemplo 3.12, cualquier entero fue un valor posible de A y la comprobación fue 

P(x) = 

Con cualquier entero positivo x, 

X x— 1 

F(x) = 2 p(y) = E(l- p)- 1 " 1 P=pE (1 - P) y (3.4) 

y<x y= 1 j=0 

Para evaluar esta suma, se utiliza el hecho de que la suma parcial de una serie geométrica es 

k { _ ak+í 

Y a y = - 

,=(> 1 -« 

Utilizando esta ecuación (3.4), con a = 1 — p y k = x — l,se obtiene 
1 — (1 — pY 

F(x) = p • - = 1 — (1 — p) x un entero positivo x 

1 - (1 - p) 
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Como F es una constante entre enteros positivos 


\ 0 x<\ 

F(x) = ] 1 — (I — p)M x>l 


(3.5) 


donde [x] es el entero más grande < jc (p. ej., [2.7] = 2). Así pues, si p = 0.51 como el ejem¬ 
plo de los nacimientos, entonces la probabilidad de tener que examinar cuando mucho cinco 
nacimientos para ver el primer niño es F( 5) = 1 — (0.49) 5 = 1 — 0.0282 = 0.9718, mien¬ 
tras que F( 10) ~ 1.0000. Esta función de distribución acumulativa se ilustra en la ñgura 3.6. 



0 1 2 3 4 M - *" * 

Figura 3.6 Gráfica de F(x) del ejemplo 3.14. ■ 

En los ejemplos presentados hasta ahora, la función de distribución acumulativa se de¬ 
rivó de la función masa de probabilidad. Este proceso puede ser invertido para obtener la 
función masa de probabilidad de la función de distribución acumulativa siempre que 
ésta esté disponible. Por ejemplo, considérese otra vez la variable aleatoria del ejemplo 3.7 
(el número de bombas en servicio en una gasolinería); los valores posibles de X son 0, 
1, . . . , 6. Entonces 

P( 3) = P(X = 3) 

= [p{ 0) + p{ 1) + p{ 2) + p{ 3)] - [p(0) + /XD + P ( 2)] 

= P(X < 3) - P(X < 2) 

= F( 3) - F{ 2) 

Más generalmente, la probabilidad de que X quede dentro de un intervalo especificado es 
fácil de obtener a partir de la función de distribución acumulativa. Por ejemplo, 

P{2 < X < 4) = p{2) + p(3) + p(4) 

= [pío) + ■ ■ ■ + P m - [pío) + pd)] 

= P(X < 4) - P(X < 1) 

= F(4) - F(l) 

Obsérvese que P(2 < X < 4) F( 4) — F(2). Esto es porque el valor 2 de X está incluido 
en 2 < X < 4, así que no se desea restar su probabilidad. Sin embargo, P(2 < X < 4) = 
F( 4) — F(2) porque X = 2 no está incluido en el intervalo 2 < X < 4. 



Para dos números cualesquiera a y b con a < b. 

P(a<X<b) = F(b) - F(a-) 

donde “a —” representa el valor posible de X más grande que es estrictamente menor 
que a. En particular, si los únicos valores posibles son enteros y si a y b son enteros, 
entonces 

P(a < X < b) = P(X = aoa+lo...o¿>) 

= F(b ) - F(a - 1) 

Con a = b se obtiene P(X = á) = Fia) — F(a — 1) en este caso. 
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La razón para restar F(a—) en lugar de F(a) es que se desea incluir P(X = a); 
F(b) — F(a) da P(a < X < b). Esta proposición se utilizará extensamente cuando se calcu¬ 
len las probabilidades binomial y de Poisson en las secciones 3.4 y 3.6. 


Ejemplo 3.15 Sea X = el número de días de ausencia por enfermedad tomados por un empleado seleccio¬ 
nado al azar de una gran compañía durante un año particular. Si el número máximo de días 
de ausencia por enfermedad permisibles al año es de 14, los valores posibles de X son 
0, 1, ... , 14. Con F(0) = 0.58, F(l) = 0.72, F( 2) = 0.76, F( 3) = 0.81, F(4) = 0.88 y 
F( 5) = 0.94, 


y 


P(2 < X < 5) = P(X = 2, 3, 4 o 5) = F( 5) - F(l) = 0.22 


P(X = 3) = F(3) - F(2) = 0.05 


EJERCICIOS Sección 3.2 (11-28) 


11. En un taller de servicio automotriz especializado en afinacio¬ 
nes se sabe que 45% de todas las afinaciones se realizan en 
automóviles de cuatro cilindros, 40% en automóviles de seis 
cilindros y 15% en automóviles de ocho cilindros. Sea X = el 
número de cilindros en el siguiente carro que va a ser afinado. 

a. ¿Cuál es la función masa de probabilidad de X7 

b. Trace tanto una gráfica lineal como un histograma de 
probabilidad de la función masa de probabilidad del 
inciso a). 

c. ¿Cuál es la probabilidad de que el siguiente carro afinado 
sea de por lo menos seis cilindros? ¿Más de seis cilin¬ 
dros? 

12. Las líneas aéreas en ocasiones venden boletos de más. Su¬ 
ponga que para un avión de 50 asientos, 55 pasajeros tienen 
boletos. Defina la variable aleatoria Y como el número de 
pasajeros con boletos que en realidad aparecen para el vue¬ 
lo. La función masa de probabilidad de Y aparece en la tabla 
adjunta. 


y 

45 46 47 48 49 50 51 52 53 54 55 

p(y) 

0.05 0.10 0.12 0.14 0.25 0.17 0.06 0.05 0.03 0.02 0.01 


a. ¿Cuál es la probabilidad de que el vuelo acomodará a to¬ 
dos los pasajeros con boleto que aparecieron? 

b. ¿Cuál es la probabilidad de que no todos los pasajeros 
con boleto que aparecieron puedan ser acomodados? 

c. Si usted es la primera persona en la lista de espera (lo que 
significa que será el primero en abordar el avión si hay 
boletos disponibles después de que todos los pasajeros 
con boleto hayan sido acomodados), ¿cuál es la probabi¬ 
lidad de que podrá tomar el vuelo? ¿Cuál es esta proba¬ 
bilidad si usted es la tercera persona en la lista de espera? 

13. Una empresa de ventas en línea dispone de seis líneas telefó¬ 
nicas. Sea X el número de líneas en uso en un tiempo espe¬ 
cificado. Suponga que la función masa de probabilidad de X 
es la que se da en la tabla adjunta. 


X 

0 

1 

2 

3 

4 

5 

6 

p(x) 

0.10 

0.15 

0.20 

0.25 

0.20 

0.06 

0.04 


Calcule la probabilidad de cada uno de los siguientes eventos. 

a. {cuando mucho tres líneas están en uso} 

b. {menos de tres líneas están en uso) 

c. {por lo menos tres líneas están en uso} 

d. {entre dos y cinco líneas, inclusive, están en uso) 

e. {entre dos y cuatro líneas, inclusive, no están en uso 

f. {por lo menos cuatro líneas no están en uso) 

14. El departamento de planeación de un condado requiere que 
un contratista presente uno, dos, tres, cuatro o cinco formas 
(según la naturaleza del proyecto) para solicitar un permiso 
de construcción. Sea Y = número de formas requeridas del 
siguiente solicitante. Se sabe que la probabilidad de que se 
requieran y formas es proporcional a y, es decir, p(y) = ky 
con y = 1, . . . , 5. 

a. ¿Cuál es el valor de kl [Sugerencia: 2:Uip(v) =1.] 

b. ¿Cuál es la probabilidad de que cuando mucho se requie¬ 
ran tres formas? 

c. ¿Cuál es la probabilidad de que se requieran entre dos y 
cuatro formas (inclusive)? 

d. ¿Podría ser p(y) = y 2 /50 con y — 1, . . . , 5 la función 
masa de probabilidad de Y'! 

15. Muchos fabricantes cuentan con programas de control de ca¬ 
lidad que incluyen la inspección de los materiales recibidos 
en busca de defectos. Suponga que un fabricante de compu¬ 
tadoras recibe tarjetas madre en lotes de cinco. Se seleccio¬ 
nan dos tarjetas de cada lote para inspeccionarlas. Se pueden 
representar los posibles resultados del proceso de selección 
por pares. Por ejemplo, el par (1, 2) representa la selec¬ 
ción de las tarjetas 1 y 2 para inspección. 

a. Mencione los diez posibles resultados diferentes. 

b. Suponga que las tarjetas 1 y 2 son las únicas tarjetas de¬ 
fectuosas en un lote de cinco. Dos tarjetas tienen que ser 
seleccionadas al azar. Defina X como el número de tarje¬ 
tas defectuosas observadas entre las inspeccionadas. En¬ 
cuentre la distribución de probabilidad de X. 

c. Sea F(x) la función de distribución acumulativa de X. Pri¬ 
mero determine F(0) = P(X < 0), F(l) y F(2); luego ob¬ 
tenga F(x) para todas las demás x. 

16. Algunas partes de California son particularmente propensas 
a los temblores. Suponga que en un área metropolitana, 30% 
de todos los propietarios de casa están asegurados contra da¬ 
ños provocados por terremotos. Se seleccionan al azar cuatro 
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propietarios de casa, sea X el número entre los cuatro que es¬ 
tán asegurados contra terremotos. 

a. Encuentre la distribución de probabilidad de X [Sugeren¬ 
cia'. Sea S un propietario de casa asegurado y F uno no 
asegurado. Entonces un posible resultado es SFSS, con 
probabilidad (0.3)(0.7)(0.3)(0.3) y el valor 3 de X asocia¬ 
do. Existen otros 15 resultados.] 

b. Trace el histograma de probabilidad correspondiente. 

c. ¿Cuál es el valor más probable de XI 

d. ¿Cuál es la probabilidad de que por lo menos dos de los 
cuatro seleccionados estén asegurados contra terremotos? 

17. El voltaje de una batería nueva puede ser aceptable (A) o 
inaceptable ((/). Una linterna requiere dos baterías, así que 
las baterías serán independientemente seleccionadas y pro¬ 
badas hasta encontrar dos aceptables. Suponga que 90% de 
todas las baterías tienen voltajes aceptables. Sea Y el núme¬ 
ro de baterías que deben ser probadas. 

a. ¿Cuál es p( 2), es decir P(Y = 2)? 

b. ¿Cuál es p( 3)? [Sugerencia: Existen dos resultados dife¬ 
rentes que producen Y — 3.] 

c. Para tener Y = 5, ¿qué debe ser cierto de la quinta bate¬ 
ría seleccionada? Mencione los cuatro resultados con los 
cuales Y = 5 y luego determine p( 5). 

d. Use el patrón de sus respuestas en los incisos a)-c) 
para obtener una fórmula general para p{y). 

18. Dos dados de seis caras son lanzados al aire en forma inde¬ 
pendiente. Sea M = el máximo de los dos lanzamientos (por 
lo tanto M( 1,5) = 5, M( 3, 3) = 3, etcétera). 

a. ¿Cuál es la función masa de probabilidad de MI [Suge¬ 
rencia: Primero determine p( 1), luego p( 2), y así sucesi¬ 
vamente.] 

b. Determine la función de distribución acumulativa de M y 
dibújela. 

19. Una biblioteca se suscribe a dos revistas de noticias semana¬ 
les, cada una de las cuales se supone que llega en el correo 
de los miércoles. En realidad, cada una puede llegar el miér¬ 
coles, jueves, viernes o sábado. Suponga que las dos llegan 
independientemente una de otra y para cada una /'(mié) 
= 0.3, P(jue) = 0.4, P(vie) = 0.2 y P(sáb) = 0.1. Sea Y = el 
número de días después del miércoles que pasan para que am¬ 
bas revistas lleguen (por lo tanto los posibles valores de Y son 
0, 1, 2 o 3). Calcule la función masa de probabilidad de 
Y = [Sugerencia: Hay 16 posibles resultados: Y(M, M) = 0, 
Y(V, J) = 2, y así sucesivamente.] 

20. Tres parejas y dos individuos solteros han sido invitados a un 
seminario de inversión y han aceptado asistir. Suponga que 
la probabilidad de que cualquier pareja o individuo particular 
llegue tarde es de 0.4 (una pareja viajará en el mismo ve¬ 
hículo, así que ambos llegarán a tiempo o bien ambos llega¬ 
rán tarde). Suponga que diferentes parejas e individuos llegan 
puntuales o tarde independientemente unos de otros. Sea X = 
el número de personas que llegan tarde al seminario. 

a. Determine la función masa de probabilidad de X. [Suge¬ 
rencia: Designe las tres parejas #1, #2 y #3 y los dos in¬ 
dividuos #4 y #5.] 

b. Obtenga la función de distribución acumulativa de X y 
úsela para calcular P( 2 < X £ 6). 

21. Suponga que lee los números de este año del New York Times y 
que anota cada número que aparece en un artículo de noticias: 
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el ingreso de un oficial ejecutivo en jefe, el número de cajas de 
vino producidas por una compañía vinícola, la contribución ca¬ 
ritativa total de un político durante el año fiscal previo, la edad 
de una celebridad y así sucesivamente. Ahora enfóquese en el 
primer dígito de cada número, el cual podría ser 1, 2, . . . , 8 
o 9. Su primer pensamiento podría ser que el primer dígito X 
de un número seleccionado al azar sería igualmente probable 
que fuera una de las nueve posibilidades (una distribución 
uniforme discreta). Sin embargo, mucha evidencia empírica así 
como también algunos argumentos teóricos, sugieren una dis¬ 
tribución de probabilidad alternativa llamada ley de Benford: 

p{x) = P(e 1 primer dígito es x ) = log 10 (1 + l/x) x = 1,2,... ,9 

a. Calcule las probabilidades individuales y compare con la 
distribución uniforme discreta correspondiente. 

b. Obtenga la función de distribución acumulativa de X. 

c. Utilizando la función de distribución acumulativa, ¿cuál 
es la probabilidad de que el primer dígito sea cuando mu¬ 
cho 3? ¿Por lo menos 5? 

[Nota: La ley de Benford es la base de algunos procedimien¬ 
tos de auditoría utilizados para detectar fraudes en reportes fi¬ 
nancieros, por ejemplo, por el Servicio de Ingresos Internos.] 

22. Remítase al ejercicio 13 y calcule y trace la gráfica de la fun¬ 
ción de distribución acumulativa F(x). Luego utilícela para 
calcular las probabilidades de los eventos dados en los inci¬ 
sos a)-d) de dicho problema. 

23. Una organización de protección al consumidor que habitual¬ 
mente evalúa automóviles nuevos reporta el número de 
defectos importantes encontrados en cada carro examinado. 
Sea X el número de defectos importantes en un carro selec¬ 
cionado al azar de cierto tipo. La función de distribución 
acumulativa de X es la siguiente: 


' 0 

x < 0 

0.06 

0<x< 1 

0.19 

1 <x<2 

0.39 

2<x<3 

0.67 

3 <*<4 

0.92 

4 < jc < 5 

0.97 

5 < x < 6 

1 

* 

VI 

VO 


Calcule las siguientes probabilidades directamente con la 
función de probabilidad acumulativa: 
a. p( 2), es decir, P(X = 2) b. P(X > 3) 

c. P( 2 < X < 5) d. P( 2<X< 5) 

24. Una compañía de seguros ofrece a sus asegurados varias opcio¬ 
nes diferentes de pago de primas. Para un asegurado seleccio¬ 
nado al azar, sea A = el número de meses entre pagos sucesivos. 
La función de distribución acumulativa es la siguiente: 


0 

x < 1 

0.30 

1 <x< 

0.40 

3 <x< 

0.45 

4 <x< 

0.60 

6 ^ x < 

1 

I2<x 
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a. ¿Cuál es la función de masa de probabilidad de XI 

b. Con sólo la función de distribución acumulativa, calcule 
P(3 < X < 6) y P( 4 < X). 

25. En el ejemplo 3.12, sea Y = el número de niñas nacidas antes 
de que termine el experimento. Con p = P(B ) y 1 — p — P(G), 
¿cuál es la función masa de probabilidad de K? [ Sugerencia: 
Primero ponga en lista los posibles valores de Y , inicie con 
el más pequeño y continúe hasta que encuentre una fórmu¬ 
la general.] 

26. Alvie Singer vive en 0 en el diagrama adjunto y sus cuatro 
amigos viven en A, B, Cy D. Un día Alvie decide visitarlos, 
así que lanza al aire una moneda imparcial dos veces para 
decidir a cuál de los cuatro visitar. Una vez que está en la 
casa de uno de sus amigos, o regresará a su casa o bien pro¬ 
seguirá a una de las dos casas adyacentes (tales como 0, A o 
C, cuando está en B) con cada una de las tres posibilidades 
cuya probabilidad es y. De este modo, Alvie continúa visi¬ 
tando a sus amigos hasta que regresa a casa. 



a. Sea X = el número de veces que Alvie visita a un amigo. 
Obtenga la función masa de probabilidad de X. 

b. Sea Y = el número de segmentos de línea recta que Alvie 
recorre (incluidos los que conducen a o que parten de 0). 
¿Cuál es la función masa de probabilidad de Y ? 

c. Suponga que sus amigas viven en A y C y sus amigos en 
B y D. Si Z = el número de visitas a amigas, ¿cuál es la 
función masa de probabilidad de Z? 

27. Después de que todos los estudiantes salieron del salón de 
clases, un profesor de estadística nota que cuatro ejemplares 
del texto se quedaron debajo de los escritorios. Al principio 
de la siguiente clase, el profesor distribuye los cuatro libros 
al azar a cada uno de los cuatro estudiantes (1, 2, 3 y 4) que 
dicen haber dejado los libros. Un posible resultado es que 1 
reciba el libro de 2, que 2 reciba el libro de 4 y que 3 reciba 
su propio libro y que 4 reciba el libro de 1. Este resultado 
puede ser abreviado como (2, 4, 3, 1). 

a. Mencione los otros 23 posibles resultados. 

b. Si X es el número de estudiantes que reciben su propio li¬ 
bro, determine la función masa de probabilidad de X. 

28. Demuestre que la función de distribución acumulativa de 
F(x) es una función no decreciente; es decir, x¡ < x 2 im¬ 
plica que F(x¡) £ F(x 2 ). ¿En qué condición será F(x l ) 
= F(x 2 )1 


3.3 Valores esperados 


O 


Considérese una universidad que tiene 15 000 estudiantes y sea X = el número de cursos en 
los cuales está inscrito un estudiante seleccionado al azar. La función de masa de probabi¬ 
lidad de X se determina como sigue. Como p(l) = 0.01, se sabe que (0.01) • (15000) = 150 
de los estudiantes están inscritos en un curso y asimismo con los demás valores de x. 


X 

1 

2 

3 

4 

5 

6 

7 

p(x) 

0.01 

0.03 

0.13 

0.25 

0.39 

0.17 

0.02 

Número de inscrito 

150 

450 

1950 

3750 

5850 

2550 

300 


El número promedio de cursos por estudiante o el valor promedio de X en la población 
se obtiene al calcular el número total de cursos tomados por todos los estudiantes y al dividir 
entre el número total de estudiantes. Como cada uno de los 150 estudiantes está tomando un 
curso, estos 150 contribuyen con 150 cursos al total. Asimismo, 450 estudiantes contribuyen 
con 2(450) cursos, y así sucesivamente. El valor promedio de la población de X es entonces 

1(150) + 2(450) + 3(1950) + • • • + 7(300) 

15000 ' ' 

Como 150/15 000 = 0.01 = p(l), 450/15000 = 0.03 = p{ 2), y así sucesivamente, una ex¬ 
presión alterna para (3.7) es 

1 * p(l) + 2 • p(2) + ■ ■ • + 7 • p(l) (3.8) 

La expresión (3.8) muestra que para calcular el valor promedio de la población de X, 
sólo se necesitan los valores posibles de X junto con las probabilidades (proporciones). En 
particular, el tamaño de la población no viene al caso en tanto la función masa de probabi¬ 
lidad esté dada por (3.6). El valor promedio o medio de X es entonces el promedio ponde¬ 
rado de los posibles valores 1, . . . , 7, donde las ponderaciones son las probabilidades de 
esos valores. 
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3.3 Valores esperados 101 

Valor esperado de X 



DEFINICIÓN 


Sea X una variable aleatoria discreta con un conjunto de valores posibles D y una fun¬ 
ción masa de probabilidad p(x). El valor esperado o valor medio de X, denotado por 
E(X) o p x , es 

E(X) = Px = X x ' P(x) 

jrGD 


Cuando está claro a que X se refiere el valor esperado, a menudo se utiliza p en lugar 
de p x . 

Ejemplo 3.16 Para la función masa de probabilidad en (3.6), 

p=l-p(l) + 2-p(2) + --- + l-p(l) 

= (1X0-01) + 2(0.03) + • • ■ + (7)(0.02) 

= 0.01 + 0.06 + 0.39 + 1.00 + 1.95 + 1.02 + 0.14 = 4.57 

Si se piensa en la población como compuesta de los valores 1, 2, . . . , 7, de X, entonces 
p = 4.57 es la media de la población. En lo que sigue, a menudo se hará referencia a p 
como la media de la población en lugar de la media de X en la población. ■ 

En el ejemplo 3.16, el valor esperado p fue 4.57, el cual no es un valor posible de X. 
La palabra esperado deberá interpretarse con precaución porque no se esperaría ver un va¬ 
lor de X de 4.57 cuando se selecciona un solo estudiante. 


Ejemplo 3.17 Exactamente después de nacer, cada niño recién nacido es evaluado en una escala llamada 
escala de Apgar. Las evaluaciones posibles son 0, 1, . . . , 10, con la evaluación del niño de¬ 
terminada por color, tono muscular, esfuerzo para respirar, ritmo cardiaco e irritabilidad re¬ 
fleja (la mejor evaluación posible es 10). Sea X la evaluación Apgar de un niño seleccionado 
al azar nacido en cierto hospital durante el siguiente año y supóngase que la función 
masa de probabilidad de X es 


X 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

p(x) 

0.002 

0.001 

0.002 

0.005 

0.02 

0.04 

0.18 

0.37 

0.25 

0.12 

0.01 


Entonces el valor medio de X es 


E(X) = p = 0(0.002) + 1(0.001) + 2(0.002) 

+ ■ ■ ■ + 8(0.25) + 9(0.12) + 10(0.01) 

= 7.15 

De nuevo, p no es un valor posible de la variable X. Además, como la variable se refiere a 
un niño futuro, no existe ninguna población existente concreta a la cual se podría referir p. 
En cambio, la función masa de probabilidad se considera como un modelo de una población 
compuesta de los valores 0, 1, 2, . . . , 10. El valor medio de esta población conceptual es 
entonces p = 7.15. ■ 


Ejemplo 3.18 


Sea X = 1 si un componente seleccionado al azar necesita servicio de garantía y = 0 si no. 
Entonces X es una variable aleatoria de Bernoulli con función masa de probabilidad 


p{x) 


1 — p x = 0 

p x = 1 

0 x A 0, 1 
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Ejemplo 3.19 


Ejemplo 3.20 


a partir de la cual E(X) = 0 • p( 0) + 1 • p{ 1) = 0(1 — p) + 1 (p) = p. Es decir, el valor es¬ 
perado de X es exactamente la probabilidad de que X tome el valor 1. Si se conceptualiza 
una población compuesta de ceros en la proporción de 1 — p y unos en la proporción de p, 
entonces el promedio de la proporción es p = p. ■ 


La forma general de función de masa de probabilidad de X = número de niños nacidos has¬ 
ta e incluido el primer varón es 


p(x) 


p( 1 — p) x 1 x = 1, 2, 3, . . . 
0 de lo contrario 


De acuerdo con la definición. 


00 

E(X) = 2 x • p(x) =X xp(\ ~ pf~ l 
D x=l 


pI 

x=l 


YT (1 ~P )X 

dp 


(3.9) 


Si se intercambia el orden de tomar la derivada y la suma, ésta es la de una serie geométri¬ 
ca. Una vez que se calcula la suma, se toma la derivada y el resultado final es E(X) = l/p. 
Si p se aproxima a 1, se espera ver que nazca un varón muy pronto, mientras que si p 
se aproxima a 0, se esperan muchos nacimientos antes del primer varón. Con p = 0.5, 
E(X) = 2. m 

Existe otra interpretación frecuentemente utilizada de p. Considérese la función ma¬ 
sa de probabilidad 


p(x) 


(0.5) • (0.5)*- 1 six= 1,2, 3,... 

0 de lo contrario 


Esta es la función masa de probabilidad de X = el número de lanzamientos al aire de una 
moneda imparcial necesarios para obtener la primera El (cara) (un caso especial del ejem¬ 
plo 3.19). Supóngase que se observa un valor x de esta función masa de probabilidad (lan¬ 
zar al aire una moneda hasta que aparezca una H (cara), luego se observa de modo 
independiente otro valor (sígase lanzando al aire la moneda), luego otro y así sucesivamen¬ 
te. Si después de observar un número muy grande de valores x se promedian, el promedio 
muestral resultante se aproximará a p = 2. Es decir, p puede ser interpretado como el valor 
promedio observado a largo plazo de X cuando el experimento se realiza de manera repetida. 


X es el número de entrevistas que un estudiante sostiene antes de conseguir un trabajo y tie¬ 
ne la función masa de probabilidad 


P(x) = 


k/x 2 x = 1, 2, 3, . . . 
0 de lo contrario 


donde k se elige de modo que Z”=i (k/x 2 ) = 1. (En un curso de matemáticas de series infi¬ 
nitas, se demostró que Y.“=\ (1/a: 2 ) < 00 , lo cual implica que tal k existe, pero su valor exac¬ 
to no interesa.) El valor esperado de X es 


CO pr CO 

p = E(X)=Z x- — =kZ ~ (3-10) 

x=l X x=l X 

La suma del lado derecho de la ecuación (3.10) es la famosa serie armónica de mate¬ 
máticas y se puede demostrar que tiende a °°. E(X) no es finita en este caso porque p(x) no 
disminuye suficientemente rápido a medida que x se incrementa; los estadísticos dicen que 
la distribución de probabilidad de X tiene “una cola gruesa”. Si se selecciona una secuencia 
de valores X utilizando esta distribución, el promedio muestral no se establecerá en un nú¬ 
mero finito sino que tenderá a crecer sin límite. 

Los estadísticos utilizan la frase “colas gruesas” en conexión con cualquier distribu¬ 
ción con una gran cantidad de probabilidad alejada de p (así que las colas gruesas no re¬ 
quieren p = °o). Tales colas gruesas hacen difícil hacer inferencias sobre p. ■ 
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Ejemplo 3.21 


Ejemplo 3.22 


e 


PROPOSICIÓN 


Ejemplo 3.23 



3.3 Valores esperados 103 


Valor esperado de una función 

A menudo interesará el valor esperado de alguna función h(X) en lugar de X propiamente 
dicha. 

Suponga que una librería adquiere diez ejemplares de un libro a $6.00 cada uno para ven¬ 
derlos a $12.00 en el entendimiento de que al final de un periodo de 3 meses cualquier 
ejemplar no vendido puede ser compensado por $2.00. Si X = el número de ejemplares ven¬ 
didos, entonces el ingreso neto = h(X) = 12X + 2(10 — X) — 60 = 10X — 40. ■ 

El siguiente ejemplo sugiere una forma fácil de calcular el valor esperado de h{X). 

Sea X = el número de cilindros del motor del siguiente carro que va a ser afinado en cierto 
taller. El costo de una afinación está relacionado con X mediante h(X) = 20 + 3X + 0.5X 2 . 
Como X es una variable aleatoria, también lo es h(X); denote esta última variable aleatoria 
por Y. Las funciones de masa de probabilidad de A y Y son las siguientes: 


X 

4 

6 8 

y 

40 

56 

76 

p{x) 

0.5 

0.3 0.2 

P(y) 

0.5 

0.3 

0.2 


Con D* denotando posibles valores de Y, 

E(Y) = E[h(X)] =Ir p(y) (3.11) 

D* 

= (40X0.5) + (56X0.3) + (76)(0.2) 

= h( 4) • (0.5) + /?(6) • (0.3) + h( 8) • (0.2) 

= 2 h(x) • p(x) 

D 

De acuerdo con la ecuación (3.11), no fue necesario determinar la función masa de proba¬ 
bilidad de Y para obtener E(Y); en su lugar, el valor esperado deseado es un promedio pon¬ 
derado de los posibles valores de h(x) (y no de x). ■ 



Si la variable aleatoria X tiene un conjunto de posibles valores D y una función 
masa de probabilidad p(x), entonces el valor esperado de cualquier función h(X), de¬ 
notada por E[h(X)] o pi h{X) , se calcula con 

EÍMX)] = 2 h(x) • p(x') 

D 


Esto es, E[h(X)] se calcula del mismo modo que E(X), excepto que h(x) sustituye a x. 

Una tienda de computadoras adquirió tres computadoras de un tipo a $500 cada una. Las 
venderá a $1000 cada una. El fabricante se comprometió a readquirir cualquier computado¬ 
ra que no se haya vendido después de un periodo especificado a $200 cada una. Sea X el nú¬ 
mero de computadoras vendidas y suponga que p( 0) = 0.1, p( 1) = 0.2, p(2) = 0.3 y 
p{ 3) = 0.4. Con h(X) denotando la utilidad asociada con la venta de X unidades, la informa¬ 
ción dada implica que h(X) = ingreso — costo = 1000X + 200(3 — X) — 1500 = 800A' — 900. 
La utilidad esperada es entonces 

E[h(X)] = h{ 0) • p( 0) + h{ 1) • p{\) + h(2) ■ p(2) + h{ 3) • p{ 3) 

= (-900)(0.1) + (-100X0.2) + (700)(0.3) + (1500)(0.4) 

= $700 ■ 
























CAPITULO 3 Variables aleatorias discretas y distribuciones de probabilidad 


Reglas de valor esperado 

La función de interés h(X) con bastante frecuencia es una función lineal aX + b. En este 
caso, E[h(X)] es fácil de calcular a partir de E(X). 


PROPOSICIÓN 


E(aX + b) = a - E(X) + b 
(O, con notación alternativa, p aX + h = a • p x + b.) 


Parafraseando, el valor esperado de una función lineal es igual a la función lineal eva¬ 
luada con el valor esperado E{X). Como h(X) en el ejemplo 3.23 es lineal y E(X) = 2, 
E[h(} 01 = 800(2) — 900 = $700, como antes. 

Comprobación 

E(aX + b) = (ox + b) • p(x) = a¿,x • p(x ) + p(x) 

D D D 

= aE(X) + b ■ 

Dos casos especiales de proposición producen dos reglas importantes de valor espe¬ 
rado. 


1. Con cualquier constante a, E(aX) = a ■ E(X) (considérese b = 0). (3.12) 

2. Con cualquier constante b, E(X + b) = E(X) + b (considérese a = 1). 


La multiplicación de X por una constante cambia la unidad de medición (de dólares a 
centavos, donde a = 100, pulgadas a centímetros, donde a = 2.54, etc.). La regla 1 dice que 
el valor esperado en las nuevas unidades es igual al valor esperado en las viejas unidades 
multiplicado por el factor de conversión a. Asimismo, si se agrega una constante b a cada 
valor posible de X, entonces el valor esperado se desplazará en esa misma cantidad cons¬ 
tante. 

Varianza de X 

El valor esperado de X describe dónde está centrada la distribución de probabilidad. Utili¬ 
zando la analogía física de colocar una masa puntual p(x) en el valor x sobre un eje unidi¬ 
mensional, si el eje estuviera entonces soportado por un fulcro colocado en p, el eje no 
tendería a ladearse. Esto se ilustra para dos distribuciones diferentes en la figura 3.7. 


pM 


p(x) 




0.5 


0.5 





. 1 

_L . 


T , , , 

■ 1 


1 2 3 A 5 


2 3 A 5 

7 8 


(a) 



(b) 



Figura 3.7 Dos distribuciones de probabilidad diferentes con p = 4. 


Aunque ambas distribuciones ilustradas en la figura 3.7 tienen el mismo centro p, la 
distribución de la figura 3.7(b) tiene una mayor dispersión o variabilidad que la de la figu¬ 
ra 3.7(a). Se utilizará la varianza de X para evaluar la cantidad de variabilidad en (la distri¬ 
bución de) X, del mismo modo que se utilizó s 2 en el capítulo 1 para medir la variabilidad 
en una muestra. 
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DEFINICIÓN 


Ejemplo 3.24 


e 


PROPOSICIÓN 


Ejemplo 3.25 



3.3 Valores esperados 105 


Sea p(x) la función masa de probabilidad de X y p su valor esperado. En ese caso la 
varianza de X, denotada por V(X) o crf o simplemente cr 2 , es 

V(X) = £ (x - p) 2 • p(x) = E[(X - p) 2 ] 

D 

La desviación estándar (DE) de X es 



La cantidad h(X) = (X - p) 2 es la desviación al cuadrado de X con respecto a su me¬ 
dia y a 2 es la desviación al cuadrado esperada, es decir, el promedio ponderado de desvia¬ 
ciones al cuadrado, donde las ponderaciones son probabilidades de la distribución. Si la 
mayor parte de la distribución de probabilidad está cerca de p, entonces cr 2 será relativamen¬ 
te pequeña. Sin embargo, existen valores x alejados de p que tienen una gran p(x), en ese 
caso a 2 será bastante grande. 

Si X es el número de cilindros del siguiente carro que va a ser afinado en un taller de servi¬ 
cio, con la función masa de probabilidad dada en el ejemplo 3.22 [p{ 4) = 0.5, p{ 6) = 0.3, 
pi 8) = 0.2, a partir de la cual p = 5.4], entonces 

8 

ViX) = a 2 = 2 (x - 5 A) 2 • p(x) 

x=4 

= (4 - 5.4) 2 (0.5) + (6 - 5.4) 2 (0.3) + (8 - 5.4) 2 (0.2) = 2.44 


La desviación estándar de X es cr = V2.44 = 1.562. ■ 

Cuando la función masa de probabilidad p(x) especifica un modelo matemático 
para la distribución de los valores de la población, tanto cr 2 como cr miden la dispersión de 
los valores en la población; cr 2 es la varianza de la población y cr es su desviación estándar. 

Fórmula abreviada para cr 2 

El número de operaciones aritméticas necesarias para calcular cr 2 pueden reducirse si se uti¬ 
liza una fórmula de cálculo alternativa. 





ViX) = cr 2 = 

2 -v 2 • p(x) 

- p 2 = EiX 2 ) - [EiX)] 2 


ID J 



Al utilizar esta fórmula, EiX 2 ) se calcula primero sin ninguna sustracción; acto seguido E(X) 
se calcula, se eleva al cuadrado y se resta (una vez) de EiX 2 ). 

La función masa de probabilidad del número de cilindros X del siguiente carro que va a ser 
afinado en un taller se dio en el ejemplo 3.24 como p( 4) = 0.5, p{ 6) = 0.3 y p{ 8) = 0.2, 
a partir de las cuales p = 5.4 y 

E{X 2 ) = (4 2 )(0.5) + (6 2 )(0.3) 4- (8 2 )(0.2) = 31.6 

Por lo tanto a 2 = 31.6 — (5.4) 2 = 2.44 en el ejemplo 3.24. ■ 
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Comprobación de la fórmula abreviada 

Expándase ( x — ¡j ¿) 2 en la definición de cr 2 para obtener x 2 — 2/juc + ¡jl 2 y luego lleve 2 a 
cada uno de los tres términos: 

ff 2 = It 2, p(x) - 2/1 • 2 A- • p(x) + p? X p(x) 

D D D 

= E(X 2 ) - 2/1 • /i + /i 2 = EiX 2 ) - ¡J 2 m 


Reglas de varianza 

La varianza de h(X) es el valor esperado de la diferencia al cuadrado entre h(X) y su valor 
esperado: 


V[h(X)] = a 2 (X) = 2 {h(x) - E[h(X)]} 2 ■ P(x) (3.13) 

D 

Cuando h(X) = aX + b, una función lineal 

h(x ) — E[h(X)\ = ax + b — (a/i + b) = a(x — /i) 

Sustituyendo esto en la ecuación (3.13) se obtiene una relación simple entre V[h(X )] y V(X)\ 


PROPOSICIÓN 

V{aX + b) = a 2 aX+b = a 2 • cr 2 and <r aX+b = |íí| • a x 



En particular, 



aX = \ ü \ ' <J X> X+b = ,T X 

(3.14) 




El valor absoluto es necesario porque a podría ser negativa, no obstante una desviación es¬ 
tándar no puede serlo. Casi siempre la multiplicación por a corresponde a un cambio de la 
unidad de medición (p. ej., kg a Ib o dólares a euros). De acuerdo con la primera relación 
en (3.14), la desviación estándar en la nueva unidad es la desviación estándar original mul¬ 
tiplicada por el factor de conversión. La segunda relación dice que la adición o sustracción 
de una constante no impacta la variabilidad; simplemente desplaza la distribución a la dere¬ 
cha o izquierda. 

Ejemplo 3.26 En el problema de ventas de computadoras del ejemplo 3.23, E(X) = 2 y 

E(X 2 ) = (0) 2 (0.1) + (1) 2 (0.2) + (2) 2 (0.3) + (3) 2 (0.4) = 5 

así que V(X) = 5 — (2) 2 = 1. La función de utilidad h(X ) = 800X — 900 tiene entonces la 
varianza (800) 2 • V(X) = (640 000)(1) = 640 000 y la desviación estándar 800. ■ 


EJERCICIOS Sección 3.3 (29-45) 


29. La función masa de probabilidad de X = el número de de¬ 
fectos importantes en un aparato eléctrico de un tipo selec¬ 
cionado al azar es 


X 

0 

1 

2 

3 

4 

P(x) 

0.08 

0.15 

0.45 

0.27 

0.05 


Calcule lo siguiente: 

a. E(X). 

b. V(X) directamente a partir de la definición. 


c. La desviación estándar de X. 

d. V(X) por medio de la fórmula abreviada. 

30. Se selecciona al azar un individuo que tiene asegurado su au¬ 
tomóvil con una compañía. Sea Y el número de infracciones 
de tránsito por las que el individuo fue citado durante los úl¬ 
timos 3 años. La función masa de probabilidad de Y es 


y 

0 

1 

2 

3 

p(y ) 

0.60 

0.25 

0.10 

0.05 
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a. Calcule E(Y). 

b. Suponga que un individuo con Y infracciones incurre en 
un recargo de $100y 2 . Calcule la cantidad esperada del 
recargo. 

31. Remítase al ejercicio 12 y calcule V(Y) y a y . Determine en¬ 
tonces la probabilidad de que Y esté dentro de una desvia¬ 
ción estándar de 1 de su valor medio. 

32. Un distribuidor de enseres para el hogar vende tres mode¬ 
los de congeladores verticales de 13.5, 15.9 y 19.1 pies cú¬ 
bicos de espacio de almacenamiento, respectivamente. Sea 
X = la cantidad de espacio de almacenamiento adquirido 
por el siguiente cliente que compre un congelador. Suponga 
que X tiene la función masa de probabilidad 


X 

13.5 

15.9 

19.1 

P(X) 

0.2 

0.5 

0.3 


a. Calcule E(X), EiX 2 ) y V(X). 

b. Si el precio de un congelador de X pies cúbicos de capa¬ 
cidad es 25X — 8.5, ¿cuál es el precio esperado pagado 
por el siguiente cliente que compre un congelador? 

c. ¿Cuál es la varianza del precio 25X — 8.5 pagado por el 
siguiente cliente? 

d. Suponga que aunque la capacidad nominal de un conge¬ 
lador X, la real es h(X) = X — 0.0 IX 2 . ¿Cuál es la capa¬ 
cidad real esperada del congelador adquirido por el 
siguiente cliente? 

33. Sea X una variable aleatoria de Bernoulli con función 
masa de probabilidad como en el ejemplo 3.18. 

a. Calcule E(X 2 ). 

b. Demuestre que V(X) = p(\ — p). 

c. Calcule EfX 19 ). 

34. Suponga que el número de plantas de un tipo particular en¬ 
contradas en una región particular (llamada cuadrante por 
ecologistas) en cierta área geográfica es una variable aleato¬ 
ria X con función masa de probabilidad 

í c/x 3 x — 1, 2, 3, . . . 

P(x) = < 

[0 de lo contrario 

¿Es E(X) finita? Justifique su respuesta (ésta es otra distribu¬ 
ción que los estadísticos llamarían de cola gruesa). 

35. Un pequeño mercado ordena ejemplares de cierta revista 
para su exhibidor de revistas cada semana. Sea X = deman¬ 
da de la revista, con función masa de probabilidad 


X 

1 2 3 4 5 6 

P(x) 

1 2 3 4 3 2 

15 15 15 15 15 15 


Suponga que el propietario de la tienda paga $1.00 por cada 
ejemplar de la revista y el precio para los consumidores es 
de $2.00. Si las revistas que se quedan al final de la semana 
no tienen valor de recuperación, ¿es mejor ordenar tres o 
cuatro ejemplares de la revista? [Sugerencia: Tanto para tres 
o cuatro ejemplares ordenados, exprese un ingreso neto 
como una función de la demanda X y luego calcule el ingre¬ 
so esperado.] 

36. Sea X el daño incurrido (en dólares) en un tipo de accidente 
durante un año dado. Valores posibles de X son 0, 1000, 


5000 y 10000 dólares con probabilidades de 0.8, 0.1, 0.08, 
y 0.02, respectivamente. Una compañía particular ofrece una 
póliza con deducible de $500. Si la compañía desea que su 
utilidad esperada sea de $100, ¿qué cantidad de prima debe¬ 
rá cobrar? 

37. Los n candidatos para un trabajo fueron clasificados como 
1, 2, 3, ... , n. Sea X = el rango de un candidato seleccio¬ 
nado al azar, de modo que X tenga la función masa de pro¬ 
babilidad 

í Un x = 1, 2, 3, . . . , n 
p(x) = j 

[0 de lo contrario 

(ésta se llama distribución uniforme discreta). Calcule E{X) 
y V(X) por medio de la fórmula abreviada. [Sugerencia: La 
suma de los primeros n enteros positivos es n(n + l)/2, 
mientras que la suma de sus cuadrados es n(n + I )(2n + 1) /6.] 

38. Sea X = el resultado cuando un dado imparcial es lanzado 
una vez. Si antes de lanzar el dado le ofrecen o (1/3.5) dóla¬ 
res o h(X) = l/X dólares, ¿aceptaría la suma garantizada o 
jugaría? [Nota: Generalmente no es cierto que l(E/X) = 

E{ l/X).] 

39. Una compañía de productos químicos en la actualidad tiene 
en existencia 100 Ib de un producto químico, el cual se ven¬ 
de a sus clientes en lotes de 5 Ib. Sea X = el número de lo¬ 
tes solicitados por un cliente seleccionado al azar y suponga 
que X tiene la función masa de probabilidad 


X 

1 

2 

3 

4 

p(x) 

0.2 

0.4 

0.3 

0.1 


Calcule E(X) y V(X). Calcule enseguida el número esperado 
de libras que quedan una vez que se envía el pedido del si¬ 
guiente cliente y la varianza del número de libras sobrantes. 
[Sugerencia: El número de libras que quedan es una función 
lineal de X.] 

40. a. Trace una gráfica lineal de la función masa de probabi¬ 

lidad de X en el ejercicio 35. Enseguida determine la 
función masa de probabilidad de —X y trace su gráfica li¬ 
neal. Con base en estas dos figuras, ¿qué se puede decir 
sobre V(X) y V{~X)7 

b. Use la proposición que implica V(aX + b) para estable¬ 
cer una relación general entre V{X) y V(—X). 

41. Use la definición en la expresión (3.13) para comprobar que 
V(aX + b) = a 2 • cr|. [Sugerencia: Con h(X) = aX + fe, 
E[h{X)} — ap + fe, donde p = E() 0.] 

42. Suponga E(X) = 5 y E[X(X - 1)] = 27.5. ¿Cuál es 

a. E(X 1 )! [Sugerencia: E[X{X - 1)] = EfX 2 - X] = EiX 2 ) 
~ E(X)U 

b. V(Xy > 

c. La relación general entre las cantidades E(X), E[X{X) — 1)] 

y v(xy> 

43. Escriba una regla general para E(X — c), donde c es una 
constante. ¿Qué sucede cuando hace c = p, el valor espera¬ 
do de X7 

44. Un resultado llamado desigualdad de Chebyshev establece 
que para cualquier distribución de probabilidad de una 
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variable aleatoria X y cualquier número fe que por lo menos 
sea 1, P( | X — /j, | a ka) £ 1/k * 1 2 3 4 . En palabras, la posibilidad 
de que el valor de X quede por lo menos a k desviaciones es¬ 
tándar de su media es cuando mucho 1/fe 2 . 

a. ¿Cuál es el valor del límite superior con fe = 2?, ¿fe = 3?, 
¿fe = 4?, ¿fe = 5?, ¿fe = 10? 

b. Calcule p, y a para la distribución del ejercicio 13. Eva¬ 
lúe enseguida P{\X — /x| > ka) con los valores de fe dados 


en el inciso a). ¿Qué sugiere esto sobre el límite superior 
con respecto a la probabilidad correspondiente? 

c. Que X tenga los valores posibles — 1, 0 y 1, con las proba¬ 
bilidades -¡g, g y -jj-, respectivamente. ¿Cuál es P( | X — ¿i [ 
a 3a) y cómo se compara con el límite correspondiente? 

d. Dé una distribución con la cual P( | X — ¿i | 5: 5oj = 0.04. 

45. Si a £ X £ b, demuestre que a E(X) b. 


3.4 Distribución de probabilidad binomial 


Existen muchos experimentos que se ajustan exacta o aproximadamente a la siguiente lista 

de requerimientos: 

1. El experimento consta de una secuencia de n experimentos más pequeños llamados en¬ 
sayos, donde n se fija antes del experimento. 

2. Cada ensayo puede dar por resultado uno de los mismos dos resultados posibles (ensa¬ 
yos dicotómicos), los cuales se denotan como éxito ( E ) y falla (F). 

3. Los ensayos son independientes, de modo que el resultado en cualquier ensayo particu¬ 
lar no influye en el resultado de cualquier otro ensayo. 

4. La probabilidad de éxito es constante de un ensayo a otro; esta probabilidad se denota 
por p. 



DEFINICIÓN 


Ejemplo 3.27 La misma moneda se lanza al aire sucesiva e independientemente n veces. De manera arbi¬ 
traria se utiliza E para denotar el resultado H (caras) y F para denotar el resultado T (cru¬ 
ces). Entonces este experimento satisface las condiciones 1-4. El lanzamiento al aire de una 
tachuela n veces, con E = punta hacia arriba y F = punta hacia abajo), también da por 
resultado un experimento binomial. ■ 

Muchos experimentos implican una secuencia de ensayos independientes para los 
cuales existen más de dos resultados posibles en cualquier ensayo. Entonces, un experimen¬ 
to binomial puede crearse dividiendo los posibles resultados en dos grupos. 

El color de las semillas de chícharo lo determina un solo lugar geométrico genético. Si los 
dos alelos en este lugar geométrico son AA o Aa (el genotipo), entonces el chícharo será 
amarillo (el fenotipo) y si el alelo es aa, el chícharo será verde. Suponga que aparean 20 se¬ 
millas Aa y se cruzan las dos semillas en cada uno de los diez pares para obtener diez nue¬ 
vos genotipos. Designe a cada nuevo genotipo como éxito ( E ) si es aa y falla (F) si es lo 
contrario. Entonces con esta identificación de S y F, el experimento es binomial con n = 10 
y p = P (genotipo aa). Si es igualmente probable que cada miembro del par contribuya con 
a o A, entonces p = P(a) • P( a) = (t)({) = ■ 

Suponga que una ciudad tiene 50 restaurantes autorizados, de los cuales 15 han cometido en 
la actualidad una seria violación del código sanitario y los otros 35 no han cometido viola¬ 
ciones serias. Hay cinco inspectores, cada uno de los cuales inspeccionará un restaurante 
durante la semana entrante. El nombre de cada restaurante se anota en un pedacito de papel 
diferente y a continuación se mezclan perfectamente, cada inspector a su vez saca uno de 


Ejemplo 3.28 


Ejemplo 3.29 


Un experimento para el que se satisfacen las condiciones 1-4 se llama experimento 
binomial. 
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los papelitos sin reemplazarlos. Anótese el ensayo í'-ésimo como éxito si el restaurante i-ési- 
mo seleccionado (i = 1, . . . , 5) no ha cometido violaciones serias. Entonces ■ 


35 

P(E en el primer ensayo) = — = 0.70 


P(E en el segundo ensayo) = P(EE) + P{FE ) 

= P(segundo E | primer E) P(primer E) 

+ /’fsegundo E | primer F) P(primer F) 

34 35 35 h5 _ 35 / 34- 15_\ _ 35 _ 


49 50 ' 49 50 50 \ 49 + 49 


50 


= 0.70 


Asimismo, se puede demostrar que P(E en el ensayo i-ésimo) = 0.70 con i = 3, 4, 5. Sin 
embargo. 


puesto que 


, 31 

P(E en el quinto ensayo EEEE ) = — = 0.67 

46 


, 35 

P(E en el quinto ensayo FFFF) = — = 0.76 

46 


El experimento no es binomial porque los ensayos no son independientes. En general, 
si se muestrea sin reemplazo, el experimento no producirá ensayos independientes. Si cada 
papelito hubiera sido reemplazado después de ser sacado, entonces los ensayos habrían 
sido independientes, pero esto podría haber dado por resultado que el mismo restaurante 
fuera inspeccionado por más de un inspector. ■ 


Ejemplo 3.30 


Un estado tiene 500000 conductores con licencia, de los cuales 400000 están asegurados. 
Se selecciona una muestra de 10 conductores sin reemplazo. El ensayo í-ésimo se denota S 
si el conductor í-ésimo seleccionado está asegurado. Aunque está situación parecería idén¬ 
tica a la del ejemplo 3.29, la diferencia importante es que el tamaño de la población mues- 
treada es muy grande con respecto al tamaño de la muestra. En este caso 


P{E en 2 I E en 1) 


399999 

499999 


0.80000 


P(E en 10 | £ en los primeros 9) = - = 0.799996 ~ 0.80000 

Estos cálculos sugieren que aunque los ensayos no son exactamente independientes, las pro¬ 
babilidades condicionales difieren tan poco una de otra que en la práctica los ensayos se 
consideran independientes con la constante P(E) = 0.8. Por lo tanto, para una muy buena 
aproximación, el experimento es binomial con n = 1 0 y p = 0.8. ■ 


Se utilizará la siguiente regla empírica para decidir si un experimento “sin reempla¬ 
zo” puede ser tratado como experimento binomial. 



REGLA 


Considérese muestreo sin reemplazo de una población dicotómica de tamaño N. Si el 
tamaño de la muestra (número de ensayos) n es cuando mucho 5% del tamaño de la 
población, el experimento puede ser analizado como si fuera exactamente un experi¬ 
mento binomial. 


Por “analizado” se quiere decir que las probabilidades basadas en suposiciones de experi¬ 
mento binomial se aproximarán bastante a las probabilidades reales “sin reemplazo”, las 
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que generalmente son más difíciles de calcular. En el ejemplo 3.29, n/N = 5/50 = 0.1 > 0.05, 
de modo que el experimento binomial no es una buena aproximación, pero en el ejemplo 
3.30, n/N = 10/500 000 < 0.05. 

Variable aleatoria binomial y distribución 

En la mayoría de los experimentos binomiales, lo que interesa es el número total de los éxi¬ 
tos ( E ), en lugar del conocimiento de qué ensayos dieron los éxitos. 


DEFINICIÓN 


La variable aleatoria binomial X asociada con un experimento binomial que consis¬ 
te en n ensayos se define como 

X = el número de los E entre los n ensayos 


Supóngase, por ejemplo, que n = 3. Entonces existen ocho posibles resultados para el ex¬ 
perimento: 

EEE EEF EFE EFF FEE FEF FFE FFF 

Por la definición de X, X(EEF) = 2, X(EFF) = 1 y así sucesivamente. Valores posibles de 
X en un experimento de n ensayos son x = 0, 1, 2, . . . , n. A menudo se escribirá X ~ 
Bin(/i, p) para indicar que X es una variable aleatoria binomial basada en n ensayos con 
probabilidad de éxito p. 


A NOTACIÓN 

Como la función masa de probabilidad de una variable aleatoria binomial X depen- 

r 


de de los dos parámetros n y p, la función masa de probabilidad se denota por b(x; 

-x 


n, p). 



Considérese primero el caso n = 4 para el cual cada resultado, su probabilidad y 
valor x correspondiente se dan en la tabla 3.1. Por ejemplo, 

P(EEFE) = P(E) • P{E) • P(F) • P{E) (ensayos independientes) 

= p • p • (1 — p) • p (constante P(E)) 

= P 3 • (1 ~ P) 


Tabla 3.1 Resultados y probabilidades de un experimento binomial 
con cuatro ensayos 


Resultado 

X 

Probabilidad 

Resultado 

X 

Probabilidad 

EEEE 

4 

p 4 

FEEE 

3 

p\ 1 - P) 

EEEF 

3 

p\ 1 - p) 

FEEF 

2 

p\ 1 -P) 2 

EEFE 

3 

p\ 1 - P) 

FEFE 

2 

p\ 1 -P) 2 

EEFF 

2 

p\ 1 ~ P) 2 

FEFF 

1 

Pi 1 ~ pf 

EFEE 

3 

p\ 1 - p) 

FFEE 

2 

P 2 { 1 ~ P) 2 

EFEF 

2 

P 2 { 1 ~ P) 2 

FFEF 

1 

P( 1 -p) 3 

EFFE 

2 

P 2 { 1 ~ P) 2 

FFFE 

1 

P(1 -p) 3 

EFFF 

1 

P( 1 -P? 

FFFF 

0 

(1 - P) 4 


En este caso especial, se desea ¿>(x; 4, p) con x = 0, 1, 2, 3 y 4. Para b( 3; 4, p), iden¬ 
tifiqúese cuál de los 16 resultados dan un valor x de 3 y sume las probabilidades asociadas 
con cada resultado. 

b( 3; 4, p) = P(EEEE) + P(EFEE) + P{EEFE) + P{EEEF) = 4/r'í l - p ) 
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TEOREMA 


Ejemplo 3.31 

0 - 
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Existen cuatro resultados con x = 3 y la probabilidad de cada uno es p 3 ( 1 — p) (el orden de 
los E y las F no es importante, sino sólo el número de los E), por lo tanto 


b(3;4,p) 


número de resultados 


probabilidad de cualquier resultado 

con X = 3 


con X = 3 


Asimismo, b( 2; 4, p) = 6/r( I — p) 2 , la cual también es el producto del número de resulta¬ 
dos con X = 2 y la probabilidad de cualquier resultado como ese. 

En general, 


b(x; n, p) 


número de secuencias de longitud n 
compuestas de los éxitos de x 


probabilidad de cualquier 
secuencia como esa 


Como el orden de los E y las F no es importante, el segundo factor en la ecuación previa es 
p x ( 1 — p) n ~ x (p. ej., los primeros x ensayos producen E y los últimos n — x producen F. El 
primer factor es el número de formas de escoger x de los n ensayos para que sean los E, es 
decir, el número de combinaciones de tamaño x que pueden ser construidas con n objetos 
distintos (ensayos en este caso). 


b(x; n, p) 


^ j p x ( 1 — p) n x x = 0, 1, 2, . . . n 
0 de lo contrario 


A cada uno de seis bebedores de refrescos de cola seleccionados al azar se le sirve un vaso 
de refresco de cola A y uno de refresco de cola B. Los vasos son idénticos en apariencia ex¬ 
cepto por un código que viene en el fondo para identificar el refresco de cola. Suponga que 
en realidad no existe una tendencia entre los bebedores de refresco de cola de preferir un re¬ 
fresco de cola al otro. Entonces p = /Aun individuo seleccionado prefiere A) = 0.5, así que 
con X = el número entre los seis que prefieren A, X ~ Bin(6, 0.5). 

Por lo tanto 

P(X = 3) = b( 3; 6, 0.5) = ^ ^ j(0.5) 3 (0.5) 3 = 20(0.5) 6 = 0.313 

La probabilidad de que por lo menos tres prefieran A es 

6 6 / 6 \ 

P(3 < X) = 2 b(x- 6, 0.5) = X (0.5)*(0.5) 6 -* = 0.656 
x=3 x=3\ X J 

y la probabilidad de que cuando mucho uno prefiera A es 

i 

P(X < 1) = X b(x- 6, 0.5) = 0.109 ■ 

x=0 

Utilización de tablas binomiales* 

Incluso con un valor relativamente pequeño de n, el cálculo de probabilidades binomiales es 
tedioso. La tabla A. 1 del apéndice tabula la función de distribución acumulativa F(x ) = P(X 
< x) con n = 5, 10, 15, 20, 25 en combinación con valores seleccionados de p. Varias otras 
probabilidades pueden entonces ser calculadas por medio de la proposición sobre funciones 
de distribución acumulativas de la sección 3.2. Una anotación de 0 en la tabla significa úni¬ 
camente que la probabilidad es 0 a tres dígitos significativos puesto que todos los valores 
ingresados en la tabla en realidad son positivos. 



* Los paquetes de programas estadísticos tales como MINITAB y R proporcionan la función masa de probabili¬ 
dad o la función de distribución acumulativa en forma casi instantánea al solicitarla para cualquier valor de p y 
n hasta 2 millones. También existe un comando en R para calcular la probabilidad de que X quede en el mismo 
intervalo. 
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NOTACIÓN 


Ejemplo 3.32 


Ejemplo 3.33 


Para X ~ Bin(n, p), la función de distribución acumulativa será denotada por 

P(X < x) = B{x\ n, p) = ^ b{y\ n, p) x = 0, 1 , ,n 

y =o 


Suponga que 20% de todos los ejemplares de un libro de texto particular no pasan una prue¬ 
ba de resistencia de encuadernación. Sea X el número entre 15 ejemplares seleccionados 
al azar que no pasan la prueba. Entonces X tiene una distribución binomial con n = 15 y 

p = 0.2. 

1. La probabilidad de que cuando mucho 8 no pasen la prueba es 

8 

P(X < 8) = 2 b(y ; 15, 0.2) = B( 8; 15, 0.2) 

y=0 

la cual es el ingreso en la fila x = 8 y la columna p = 0.2 de la tabla binomial 
n = 15. Según la tabla A. 1 del apéndice, la probabilidad es B( 8; 15, 0.2) = 0.999. 

2. La probabilidad de que exactamente 8 fallen es 


P(X = 8) = P(X < 8) - P(X < 7) = B( 8; 15, 0.2) - B{1\ 15, 0.2) 

la cual es la diferencia entre dos ingresos consecutivos en la columna p = 0.2. El resul¬ 
tado es 0.999 — 0.996 = 0.003. 

3. La probabilidad de que por lo menos 8 fallen es 

P(X > 8) = 1 - P(X < 7) = 1 - B( 7; 15, 0.2) 

_ _ /ingreso en x = 7 \ 

t^fila de columna p = 0.2 ) 

= 1 - 0.996 = 0.004 

4 . Finalmente, la probabilidad de que entre 4 y 7, inclusive, fallen es 


P(4 < X < 7) = P(X = 4, 5, 6 o 7) = P(X < 7) - P(X < 3) 

= B(7; 15, 0.2) - B(3; 15, 0.2) = 0.996 - 0.648 = 0.348 


Obsérvese que esta última probabilidad es la diferencia entre los ingresos en las filas x = 7 
y x = 3, «o en las filas x = 7 y x = 4. ■ 


Un fabricante de aparatos electrónicos afirma que cuando mucho 10% de sus unidades de 
suministro de potencia necesitan servicio durante el periodo de garantía. Para investigar 
esta afirmación, técnicos en un laboratorio de prueba adquieren 20 unidades y someten a 
cada una a una prueba acelerada para simular el uso durante el periodo de garantía. Sea p 
la probabilidad de que una unidad de suministro de potencia necesite reparación durante el 
periodo (proporción de unidades que requieren reparación). Los técnicos de laboratorio deben 
decidir si los datos obtenidos con el experimento respaldan la afirmación de que p < 0.10. Sea 
X el número entre las 20 muestreadas que necesitan reparación, así que X ~ Bin(20, p). Con¬ 
sidere la regla de decisión 

Rechazar la afirmación de que p < 0.10 a favor de la conclusión de que p > 0.10 si 
x s 5 (donde x es el valor observado de X) y considere posible la afirmación si x < 4. 

La probabilidad de que la afirmación sea rechazada cuando p = 0.10 (una conclusión inco¬ 
rrecta) es 

P(X > 5 cuando p = 0.10) = 1 - B( 4; 20, 0.1) = 1 - 0.957 = 0.043 
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La probabilidad de que la afirmación no sea rechazada cuando p = 0.20 (un tipo diferente 
de conclusión incorrecta) es 

P(X < 4 cuando p = 0.2) = 5(4; 20, 0.2) = 0.630 

La primera probabilidad es algo pequeña, pero la segunda es intolerablemente grande. 
Cuando p = 0.20, significa que el fabricante subestimó de manera excesiva el porcenta¬ 
je de unidades que necesitan servicio y si se utiliza la regla de decisión establecida, ¡el 63% 
de las muestras dan como resultado que la afirmación del fabricamte se considere plausible! 

Se podría pensar que la probabilidad de este segundo tipo de conclusión errónea po¬ 
dría hacerse más pequeña cambiando el valor de corte de 5 en la regla de decisión por algún 
otro. Sin embargo, aunque el reemplazo de 5 por un número más pequeño daría una proba¬ 
bilidad más pequeña que 0.630, la otra probabilidad se incrementaría entonces. La única 
forma de hacer ambas “probabilidades de error” pequeñas es basar la regla de decisión en 
un experimento que implique muchas más unidades. ■ 

La media y varianza de X 

Con n = 1, la distribución binomial llega a ser la distribución de Bernoulli. De acuerdo con 
el ejemplo 3.18, el valor medio de una variable de Bernoulli es p = p, así que el número 
esperado de los S en cualquier ensayo único es p. Como un experimento binomial se com¬ 
pone de n ensayos, la intuición sugiere que para X ~ Bin (n, p), E(X) = np, el producto del 
número de ensayos y la probabilidad de éxito en un solo ensayo. La expresión para V(X) no 
es tan intuitiva. 



PROPOSICIÓN 


Si X ~ Bin(n, p), entonces E(X) = np, V(X) = np( 1 — p) = npq y cr x = vnpq (don¬ 
de q = 1 — p). 


Por tanto, para calcular la media y varianza de una variable aleatoria binomial no se requie¬ 
re evaluar las sumas. La comprobación del resultado para E(X) se ilustra en el ejercicio 64. 

Ejemplo 3.34 Si 75% de todas las compras en una tienda se hacen con tarjeta de crédito y X es el número 
entre diez compras seleccionadas al azar realizadas con tarjeta de crédito, entonces X ~ 
Bin(10, 0.75). Por lo tanto, E(X) = np = (10)(0.75) = 7.5, V(X) = npq = 10(0.75)(0.25) = 
1.875 y cr = Vi.875. Otra vez, aun cuando X puede tomar sólo valores enteros, E(X) no tiene 
que ser un entero. Si se realiza un gran número de experimentos binomiales independientes, 
cada uno con n = 10 ensayos y p = 0.75, entonces el número promedio de los E por expe¬ 
rimento se acercará a 7.5. ■ 



EJERCICIOS Sección 3.4 (46-67) 


46. Calcule las siguientes probabilidades binomiales directamen¬ 
te con la fórmula para b(x\ n, p): 

a. b{ 3; 8, 0.35) 

b. b( 5; 8, 0.6) 

c. P( 3 < X < 5) cuando n = 7 y p = 0.6 

d. P( 1 < X) cuando n = 9 y p = 0.1 

47. Use la tabla A.l del apéndice para obtener las siguientes 
probabilidades: 

a. 5(4; 15, 0.3) 

b. b{ 4; 15, 0.3) 


c. b( 6; 15, 0.7) 

d. P(2 < X < 4) cuando X ~ Bin(15, 0.3) 

e. P(2 < X) cuando X ~ Bin(15, 0.3) 

f. P(X < 1) cuando X ~ Bin(15, 0.7) 

g. P(2 < X < 6) cuando X ~ Bin(15, 0.3) 

48. Cuando se utilizan tarjetas de circuito en la fabricación de 
reproductores de discos compactos se prueban; el porcenta¬ 
je de defectuosas es de 5%. Sea X = el número de tarjetas 
defectuosas en una muestra aleatoria de tamaño n = 25, así 
que X ~ Bin(25, 0.05). 
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a. Determine P(X < 2). 

b. Determine P(X a 5). 

c. Determine P( \ < X < 4). 

d. ¿Cuál es la probabilidad que ninguna de estas 25 tarjetas 
esté defectuosa? 

e. Calcule el valor esperado y la desviación estándar X. 

49. Una compañía que produce cristales finos sabe por expe¬ 
riencia que 10% de sus copas de mesa tienen imperfecciones 
cosméticas y deben ser clasificadas como “de segunda”. 

a. Entre seis copas seleccionadas al azar, ¿qué tan probable 
es que sólo una sea de segunda? 

b. Entre seis copas seleccionadas al azar, ¿qué tan probable es 
que por lo menos dos sean de segunda? 

c. Si las copas se examinan una por una, ¿cuál es la proba¬ 
bilidad de cuando mucho cinco deban ser seleccionadas 
para encontrar cuatro que no sean de segunda? 

50. Se utiliza un número telefónico particular para recibir tanto lla¬ 
madas de voz como faxes. Suponga que 25% de las llamadas 
entrantes son faxes y considere una muestra de 25 llamadas en¬ 
trantes. ¿Cuál es la probabilidad de que 

a. Cuando mucho 6 de las llamadas sean un fax? 

b. Exactamente 6 de las llamadas sean un fax? 

c. Por lo menos 6 de las llamadas sean un fax? 

d. Más de 6 de las llamadas sean un fax? 

51. Remítase al ejercicio previo. 

a. ¿Cuál es el número esperado de llamadas entre las 25 que 
impliquen un fax? 

b. ¿Cuál es la desviación estándar del número entre las 25 
llamadas que implican un fax? 

c. ¿Cuál es la probabilidad de que el número de llamadas 
entre las 25 que implican una transmisión de fax so¬ 
brepase el número esperado por más de 2 desviaciones 
estándar? 

52. Suponga que 30% de todos los estudiantes que tienen que 
comprar un texto para un curso particular desean un ejem¬ 
plar nuevo (¡los exitosos!), mientras que el otro 70% desea 
comprar un ejemplar usado. Considere seleccionar 25 com¬ 
pradores al azar. 

a. ¿Cuáles son el valor medio y la desviación estándar del 
número que desea un ejemplar nuevo del libro? 

b. ¿Cuál es la probabilidad de que el número que desea 
ejemplares nuevos esté a más de dos desviaciones están¬ 
dar del valor medio? 

c. La librería tiene 15 ejemplares nuevos y 15 usados en exis¬ 
tencia. Si 25 personas llegan una por una a comprar el tex¬ 
to, ¿cuál es la probabilidad de las 25 que obtengan el tipo 
de libro que desean de las existencias actuales? [ Sugeren¬ 
cia v. Sea X = el número que desea un ejemplar nuevo. 
¿Con qué valores de X obtendrán las 15 lo que desean?] 

d. Suponga que los ejemplares nuevos cuestan SI00 y los 
usados $70. Suponga que la librería en la actualidad tie¬ 
ne 50 ejemplares nuevos y 50 usados. ¿Cuál es el valor 
esperado del ingreso total por la venta de los siguientes 
25 ejemplares comprados? Asegúrese de indicar qué re¬ 
gla de valor esperado está utilizando. [ Sugerencia : Sea 
h(X) = el ingreso cuando X de los 25 compradores de¬ 
sean ejemplares nuevos. Exprese esto como una función 
lineal.] 


53. El ejercicio 30 (sección 3.3) dio la función masa de proba¬ 
bilidad de L, el número de citaciones de tránsito de un indi¬ 
viduo seleccionado al azar asegurado por una compañía 
particular. ¿Cuál es la probabilidad de que entre 15 indivi¬ 
duos seleccionados al azar 

a. por lo menos 10 no tengan citaciones? 

b. menos de la mitad tengan por lo menos una citación? 

c. el número que tengan por lo menos una citación esté en¬ 
tre 5 y 10, inclusive?” 

54. Un tipo particular de raqueta de tenis viene en tamaño me¬ 
diano y en tamaño extragrande. El 60% de todos los clientes 
en una tienda desean la versión extragrande. 

a. Entre diez clientes seleccionados al azar que desean este 
tipo de raqueta, ¿cuál es la probabilidad de que por lo 
menos seis deseen la versión extragrande? 

b. Entre diez clientes seleccionados al azar, ¿cuál es la proba¬ 
bilidad de que el número que desea la versión extragrande 
esté dentro de una desviación estándar del valor medio? 

c. La tienda dispone actualmente de siete raquetas de cada 
versión. ¿Cuál es la probabilidad de que los siguientes 
diez clientes que desean esta raqueta puedan obtener la 
versión que desean de las existencias actuales? 

55. El 20% de todos los teléfonos de cierto tipo son llevados a 
servicio mientras se encuentran dentro de la garantía. De és¬ 
tos, 60% puede ser reparado, mientras el 40% restante debe 
ser reemplazado con unidades nuevas. Si una compañía ad¬ 
quiere diez de estos teléfonos, ¿cuál es la probabilidad de 
que exactamente dos sean reemplazados bajo garantía? 

56. La Junta de Educación reporta que 2% de los dos millones 
de estudiantes de preparatoria que toman el SAT cada año 
reciben un trato especial a causa de discapacidades documen¬ 
tadas (Los Angeles Times, 16 de julio de 2002). Considere 
una muestra aleatoria de 25 estudiantes que recientemente 
presentaron el examen. 

a. ¿Cuál es la probabilidad de que exactamente 1 reciba un 
trato especial? 

b. ¿Cuál es la posibilidad de que por lo menos 1 reciba 
un trato especial? 

c. ¿Cuál es la probabilidad de que por lo menos 2 reciban 
un trato especial? 

d. ¿Cuál es la probabilidad de que el número entre los 25 
que recibieron un trato especial esté dentro de 2 desvia¬ 
ciones estándar del número que esperaría reciba un trato 
especial? 

e. Suponga que a un estudiante que no recibe un trato espe¬ 
cial se le permiten 3 horas para el examen, mientras que 
a un estudiante que recibió un trato especial se le permi¬ 
ten 4.5 horas. ¿Qué tiempo promedio piensa que le sería 
permitido a los 25 estudiantes seleccionados? 

57. Suponga que 90% de todas las baterías de cierto proveedor 
tienen voltajes aceptables. Un tipo de linterna requiere que 
las dos baterías sean tipo D y la linterna funcionará sólo 
si sus dos baterías tienen voltajes aceptables. Entre diez lin¬ 
ternas seleccionadas al azar, ¿cuál es la probabilidad de que 
por lo menos nueve funcionarán? ¿Qué suposiciones hizo 
para responder la pregunta planteada? 

' “Entre ay b, inclusive” equivale a (a £ X £ b). 
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58. Un distribuidor recibe un lote muy grande de componentes. 
El lote sólo puede ser caracterizado como aceptable si la 
proporción de componentes defectuosos es cuando mucho 
de 10. El distribuidor decide seleccionar 10 componentes al 
azar y aceptar el lote sólo si el número de componentes de¬ 
fectuosos presentes en la muestra es cuando mucho de 2. 

a. ¿Cuál es la probabilidad de que el lote será aceptado 
cuando la proporción real de componentes defectuosos es 
de 0.01?, 0.05? 0.10? 0.20? 0.25? 

b. Sea p la proporción real de componentes defectuosos 
presentes en el lote. Una gráfica de P {se acepta el lote) en 
función de p y con p sobre el eje horizontal y P {se acep¬ 
ta el lote) sobre el eje vertical, se llama curva caracterís¬ 
tica de operación del plan de muestreo de aceptación. 
Use los resultados del inciso a) para trazar esta curva con 
0 <p < 1. 

c. Repita los incisos a) y b) con “1” reemplazando a “2” en 
el plan de muestreo de aceptación. 

d. Repita los incisos a) y b) con “15” reemplazando a “10” 
en el plan de muestreo de aceptación. 

e. ¿Cuál de estos planes de muestreo, el del inciso a), c) o 
d) parece más satisfactorio y por qué? 

59. Un reglamento que requiere que se instale un detector de 
humo en todas las casas previamente construidas ha estado 
en vigor en una ciudad particular durante 1 año. Al departa¬ 
mento de bomberos le preocupa que muchas casas perma¬ 
nezcan sin detectores. Sea p = la proporción verdadera de 
las casas que tienen detectores y suponga que se inspeccio¬ 
na una muestra aleatoria de 25 casas. Si ésta indica marca¬ 
damente que menos de 80% de todas las casas tienen un 
detector, el departamento de bomberos lanzará una campaña 
para la puesta en ejecución de un programa de inspección 
obligatorio. Debido a lo caro del programa, el departamento 
prefiere no requerir tales inspecciones a menos que una evi¬ 
dencia muestral indique que se requieren. Sea X el número 
de casas con detectores entre las 25 muestreadas. Considere 
rechazar el requerimiento de que p S 0.8 si x £ 15. 

a. ¿Cuál es la probabilidad de que el requerimiento sea re¬ 
chazado cuando el valor real de p es 0.8? 

b. ¿Cuál es la probabilidad de no rechazar el requerimiento 
cuando p = 0.7? ¿Cuándo p = 0.6? 

c. ¿Cómo cambian las “probabilidades de error” de los inci¬ 
sos a) y b) si el valor 15 en la regla de decisión es reem¬ 
plazado por 14? 

60. Un puente de cuota cobra $1.00 por cada automóvil de uso 
particular y $2.50 por cualquier otro vehículo. Suponga que 
durante el día 60% son vehículos de uso particular. Si 25 
vehículos cruzan el puente durante un periodo determinado 
del día, ¿cuál es la expectativa de ingresos resultantes en el 
día? [Sugerencia: Exprese X = número de automóviles de 
uso particular; cuando el ingreso por concepto de cuota h(X) 
es una función lineal de X], 

61. Un estudiante que está tratando de escribir un ensayo para 
un curso tiene la opción de dos temas, A y B. Si selecciona 
el tema A, el estudiante pedirá dos libros mediante préstamo 
interbiblioteca, mientras que si selecciona el tema B, el es¬ 
tudiante pedirá cuatro libros. El estudiante cree que un buen 
ensayo necesita recibir y utilizar por lo menos la mitad de 
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los libros pedidos para uno u otro tema seleccionado. Si la 
probabilidad de que un libro pedido mediante préstamo inter¬ 
biblioteca llegue a tiempo es de 0.9 y los libros llegan inde¬ 
pendientemente uno de otro, ¿qué tema deberá seleccionar el 
estudiante para incrementar al máximo la probabilidad de es¬ 
cribir un buen ensayo? ¿Qué pasa si la probabilidad de que lle¬ 
guen los libros es de sólo 0.5 en lugar de 0.9? 

62. a. Con n fijo, ¿hay valores de p{ 0 < p < 1) para los cuales 

V(X) = 0? Explique por qué esto es así. 
b. ¿Con qué valor de p se incrementa al máximo V(X)7 [Su¬ 
gerencia: Trace la gráfica de V(X) en función de p o bien 
tome una derivada.] 

63. a. Demuestre que b(x\ n, 1 — p) = b(n — x; n, p). 

b. Demuestre que B{x\ n, 1 — p) = 1 — B{n — x — 1; n, p). 
[Sugerencia'. Cuando mucho x éxitos (S) equivalen a por 
lo menos (n — x) fracasos (F).] 

c. ¿Qué implican los incisos a) y b) sobre la necesidad de 
incluir valores de p más grandes que 0.5 en la tabla A. 1 
del apéndice? 

64. Demuestre que E{X) = np cuando X es una variable aleatoria 
binomial [ Sugerencia : Primero exprese E{X) como una suma 
con límite inferior x = 1. Luego saque a np como factor, sea 
y = x — 1 de modo que la suma sea dey = 0ay = n— 1 
y demuestre que la suma es igual al.] 

65. Los clientes en una gasolinería pagan con tarjeta de crédi¬ 
to (A), tarjeta de débito (B) o efectivo (C). Suponga qué 
clientes sucesivos toman decisiones independientes con 
P(A) = 0.5, P(B) = 0.2 y P(Q = 0.3. 

a. Entre los siguientes 100 clientes, ¿cuáles son la media y 
varianza del número que paga con tarjeta de débito? Ex¬ 
plique su razonamiento. 

b. Conteste el inciso a) para el número entre 100 que no pa¬ 
gan con efectivo. 

66. Una limusina de aeropuerto puede transportar hasta cuatro 
pasajeros en cualquier viaje. La compañía aceptará un máxi¬ 
mo de seis reservaciones para un viaje y un pasajero debe te¬ 
ner una reservación. Según registros previos, 20% de los que 
reservan no se presentan para el viaje. Responda las siguien¬ 
tes preguntas, suponiendo independencia en los casos en que 
sea apropiado. 

a. Si se hacen seis reservaciones, ¿cuál es la probabilidad de 
que por lo menos un individuo con reservación no pueda 
ser acomodado en el viaje? 

b. Si se hacen seis reservaciones, ¿cuál es el número espe¬ 
rado de lugares disponibles cuando la limusina parte? 

c. Suponga que la distribución de probabilidad del número 
de reservaciones hechas se da en la tabla adjunta. 


Número de reservaciones 

3 

4 

5 

6 

Probabilidad 

0.1 

0.2 

0.3 

0.4 


Sea X el número de pasajeros en un viaje seleccionado al 
azar. Obtenga la función masa de probabilidad de X. 

67. Remítase a la desigualdad de Chebyshev dada en el ejercicio 
44. Calcule P( | X — p. | a k&) con k — 2 y k = 3 cuando 
X ~ Bin (20, 0.5) y compare con el límite superior corres¬ 
pondiente. Repita paralé ~ Bin(20, 0.75). 
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3.5 Distribuciones hipergeométricas 
y binomiales negativas 

Las distribuciones hipergeométricas y binomiales negativas están relacionadas con la distri¬ 
bución binomial. En tanto que la distribución binomial es el modelo de probabilidad apro¬ 
ximada de muestreo sin reemplazo de una población dicotómica finita ( E-F ), la distribución 
hipergeométrica es el modelo de probabilidad exacta del número de éxitos (E) en la mues¬ 
tra. La variable aleatoria binomial X es el número de éxitos cuando el número n de ensayos 
es fijo, mientras que la distribución binomial surge de fijar el número de éxitos deseados y 
de permitir que el número de ensayos sea aleatorio. 

Distribución hipergeométrica 

Las suposiciones que conducen a la distribución hipergeométrica son las siguientes: 

1. La población o conjunto que se va a muestrear se compone de N individuos, objetos o 
elementos (una población finita). 

2. Cada individuo puede ser caracterizado como éxito (E) o falla (F) y hay M éxitos en la 
población. 

3. Se selecciona una muestra de n individuos sin reemplazo de tal modo que cada subcon¬ 
junto de tamaño n es igualmente probable de ser seleccionado. 

La variable aleatoria de interés es X = el número de éxitos en la muestra. La distribución de 
probabilidad de X depende de los parámetros n, M y N, así que se desea obtener P(X = x) = 
li(x\ n, M, N). 

Ejemplo 3.35 Durante un periodo particular una oficina de tecnología de la información de una universi¬ 
dad recibió 20 solicitudes de servicio de problemas con impresoras, de las cuales 8 eran im¬ 
presoras láser y 12 eran modelos de inyección de tinta. Se tiene que seleccionar una muestra 
de 5 de estas solicitudes de servicio completamente al azar, de modo que cualquier subcon¬ 
junto de tamaño 5 tenga la misma probabilidad de ser seleccionado como cualquier otro 
subconjunto (piense en escribir los números 1, 2, . . . , 20 en 20 papelitos idénticos, mez¬ 
clarlos y seleccionar 5 de ellos). ¿Cuál es entonces la probabilidad de que exactamente 
x(x = 0, 1, 2, 3, 4 o 5) de las solicitudes de servicio fueran para impresoras de inyección de 
tinta? 

En este caso, el tamaño de la población es N = 20, el tamaño de la muestra es n = 5 
y el número de éxitos (inyección de tinta = E ) y las fallas (F) en la población son M = 12 
y N — M = 8, respectivamente. Considérese el valor x = 2. Como todos los resultados (ca¬ 
da uno consta de 5 solicitudes particulares) son igualmente probables. 

número de resultados con X = 2 

P(X = 2) = h( 2; 5, 12, 20) = - 

número de posibles resultados 

El número de posibles resultados en el experimento es el número de formas de seleccionar 
5 de los 20 objetos sin importar el orden, es decir, ( 2 5 °). Para contar el número de resultados 
con X = 2, obsérvese que existen (^) formas de seleccionar 2 de la solicitudes para impresoras 
de inyección de tinta, y por cada forma existen (*) formas de seleccionar las 3 solicitudes pa¬ 
ra impresoras láser a fin de completar la muestra. La regla de producto del capítulo 2 da en¬ 
tonces C 2 2 )© como el número de resultados con X = 2, por lo tanto 

/12\/8\ 
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En general, si el tamaño de la muestra n es más pequeño que el número de éxitos en 
la población (M), entonces el valor de X más grande posible es n. Sin embargo, si M < n (p. 
ej., un tamaño de muestra de 25 y sólo hay 15 éxitos en la población), entonces X puede ser 
cuando mucho M. Asimismo, siempre que el número de fallas en la población (Ai — M) so¬ 
brepase el tamaño de la muestra, el valor más pequeño de X es 0 (puesto que todos los in¬ 
dividuos muestreados podrían entonces ser fallas). Sin embargo, si N — M < n, el valor más 
pequeño posible de X es n — (N — M). Por lo tanto, los posibles valores de X satisfacen la 
restricción máx(0, n — (N — M)) < .v < mín(«, M). Un argumento paralelo al del ejemplo 
previo da la función masa de probabilidad de X. 


PROPOSICIÓN 


Si X es el número de éxitos ( E ) en una muestra completamente aleatoria de tamaño n 
extraída de la población compuesta de M éxitos y (N — M) fallas, entonces la distri¬ 
bución de probabilidad de X llamada distribución hipergeométrica, es 


P(X = x) = h(x\ n, M,N) = 


M\/N - M 
x )\ n — x 

isr 

n 


(3.15) 


con x un entero que satisface máx(0, n — N + M) < x < mín(n, M). 



En el ejemplo 3.35, n = 5, M = 12 y Ai = 20, por lo tanto h{x\ 5, 12, 20) con x = 0, 1,2, 
3, 4, 5 se obtiene sustituyendo estos números en la ecuación (3.15). 


Ejemplo 3.36 Se capturaron, etiquetaron y liberaron cinco individuos de una población de animales que 
se piensa están al borde de la extinción en una región para que se mezclen con la población. 
Después de haber tenido la oportunidad de mezclarse, se selecciona una muestra aleatoria 
de 10 de estos animales. Sea X = el número de animales etiquetados en la segunda mues¬ 
tra. Si en realidad hay 25 animales de este tipo en la región, ¿cuál es la probabilidad de que 
a) X = 2? b) ¿X < 2? 

Los valores de los parámetros son n = 10, M = 5 (cinco animales etiquetados en la 
población) y N = 25, por lo tanto 


h(x ; 10, 5, 25) 



x = 0, 1,2, 3,4,5 


Para el inciso a) 


P(X = 2) = h{ 2; 10, 5, 25) = 


IT 

25 

10 


= 0.385 


Para el inciso b) 


P{X < 2) = P(X = 0, 1 o 2) = 2 Kx-, 10, 5, 25) 

x=0 


= 0.057 + 0.257 + 0.385 = 0.699 


Están disponibles tablas amplias de la distribución hipergeométrica, pero como la dis¬ 
tribución tiene tres parámetros, estas tablas requieren mucho más espacio que las tablas 
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para la distribución binomial. MIN1TAB y otros paquetes de software de estadística gene¬ 
ran con facilidad las probabilidades hipergeométricas. 

Como en el caso binomial, existen expresiones simples para E(X) y V(X) para varia¬ 
bles aleatorias hipergeométricas. 


PROPOSICIÓN 


La media y la varianza de la variable aleatoria hipergeométrica X cuya función masa 
de probabilidad es h(x\ n, M, N) son 


E(X) = n 


M 

N 


V(X) 


/ N — n \ M 
\ N- 1 )' n ‘ N 



La razón M/N es la proporción de éxitos en la población. Si se reemplaza M/N por p 
en E(X) y V(X), se obtiene 


E(X) = np 

( N — n\ 


(3.16) 


La expresión (3.16) muestra que las medias de las variables aleatorias binomiales e hiper¬ 
geométricas son iguales, en tanto que las varianzas de las dos variables aleatorias difieren 
por el factor (N — n)/(N — 1), a menudo llamado factor de corrección por población finita. 
Este factor es menor que 1, así que la variable hipergeométrica tiene una varianza más pe¬ 
queña que la variable aleatoria binomial. El factor de corrección puede escribirse como (1 
— n/N)(l — 1//V), el cual es aproximadamente 1 cuando n es pequeño con respecto a N. 


Ejemplo 3.37 

(continuación del 
ejemplo 3.36) 


En el ejemplo de etiquetación de animales, n = 1 0, M = 5 V A' = 25, por lo tanto p = jr = 
0.2 y 

E(X) = 10(0.2) = 2 
15 

V(X ) = —(10)(0.2)(0.8) = (0.625X1.6) = 1 


Si el muestreo se realizó con reemplazo, V(X) = 1.6. 

Suponga que en realidad no se conoce el tamaño de la población N, así que se obser¬ 
va el valor x y se desea estimar N. Es razonable igualar la proporción muestral observada de 
éxitos, xln, y la proporción de la población, M/N da la estimación 

~ M • n 

N= - 

x 

Si M = 100, n = 40 y x = 16, entonces Ñ = 250. ■ 


La regla general empírica dada en la sección 3.4 plantea que si el muestreo se realizó 
sin reemplazo pero n/N era cuando mucho de 0.05, entonces la distribución binomial podría 
ser utilizada para calcular probabilidades aproximadas que implican el número de éxitos en 
la muestra. Un enunciado más preciso es el siguiente. Permita que el tamaño de la pobla¬ 
ción A y el número de M éxitos presentes en la población, se hagan más grandes a medida 
que la razón M/N tiende a p. Entonces h(x] n, M, N) tiende a b(x\ n, //); así que con n/N pe¬ 
queña, las dos son aproximadamente iguales siempre que p no esté muy cerca de 0 o 1. 
Este es el razonamiento de la regla empírica. 


Distribución binomial negativa 

La variable aleatoria y la distribución binomial negativa se basan en un experimento que sa¬ 
tisface las siguientes condiciones: 
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1. El experimento consiste en una secuencia de ensayos independientes. 

2. Cada ensayo puede dar por resultado un éxito (E) o una falla (F). 

3. La probabilidad de éxito es constante de un ensayo a otro, por lo tanto P{E en el ensayo 
i) = p con i = 1, 2, 3. . . . 

4. El experimento continúa (se realizan ensayos) hasta que un total de r éxitos hayan sido 
observados, donde r es un entero positivo especificado. 

La variable aleatoria de interés es X = el número de fallas que preceden al r-ésimo éxito; X 
se llama variable aleatoria binomial negativa porque, en contraste con la variable aleato¬ 
ria binomial, el número de éxitos es fijo y el número de ensayos es aleatorio. 

Posibles valores de X son 0,1,2,.... Sea nb(x; r, p) la función masa de probabilidad 
de X. El evento [X = x} equivale a {r — 1 éxitos en los primeros (x + r — 1) ensayos y un 
éxito ( E ) en el ensayo (x + r) perceptil} (p. ej., si r = 5 y x = 10, entonces debe haber cua¬ 
tro éxitos en los primeros 14 ensayos y en el ensayo 15 debe ser un éxito). Como los ensa¬ 
yos son independientes, 

nb(x\ r, p) = P(X = x) 

= P(r — 1 éxitos en los primeros x + r — 1 ensayos) • P(E) (3.17) 

La primera probabilidad en el miembro de más a la derecha de la expresión (3.17) es la pro¬ 
babilidad binomial 


(x + r - 

l '‘“I 


‘(1 “ Pf 


donde P(E ) = p 



PROPOSICIÓN 


La función masa de probabilidad de la variable aleatoria binomial negativa X con 
los parámetros r = número de éxitos (E ) y p = P(E ) es 


nb(x\ r, p) 


(x + r - 
l r-\ 


Vd -py 


x = 0, 1,2,... 


Ejemplo 3.38 Un pediatra desea reclutar cinco parejas, cada una de las cuales espera a su primer hijo, 
para participar en un nuevo régimen de alumbramiento natural. Sea p = P(una pareja selec¬ 
cionada al azar está de acuerdo en participar). Si p = 0.2, ¿cuál es la probabilidad de que 15 
parejas tengan que ser entrevistadas antes de encontrar cinco que estén de acuerdo en parti¬ 
cipar? Es decir, E = {está de acuerdo en participar}, ¿cuál es la probabilidad de que ocurran 
10 fallas antes del quinto éxitol Sustituyendo r = 5, p = 0.2 y x = 10 en nb(x; r, p) da 


nb( 10; 5, 0.2) 


14 

4 


j(0.2) 5 (0.8) 10 = 0.034 


La probabilidad de que cuando mucho se observen 10 fallas (cuando mucho con 15 parejas 
entrevistadas) es 


10 to 

P(X < 10) = 2 nb(x ; 5, 0.2) = (0.2) 5 £ 

*=0 x=0 


X + ■ 

4 


(0.8)" = 0.164 


En algunas fuentes, la variable aleatoria binomial negativa se considera como el nú¬ 
mero de ensayos X + r en lugar del número de fallas. 

En el caso especial r = 1, la función masa de probabilidad es 


nb(x\ 1, p) = (1 — p) x p x = 0, 1, 2, . . . (3.18) 

En el ejemplo 3.12, la función masa de probabilidad se derivó para el número de ensayos 
necesarios para obtener el primer éxito (E) y allí la función masa de probabilidad es simi¬ 
lar a la expresión (3.18). En la literatura se hace referencia tanto aX = número de fallas ( F ) 
como a Y = número de ensayos (= 1 + X) como variables aleatorias geométricas y la 
función masa de probabilidad en la expresión (3.18) se llama distribución geométrica. 
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En el ejemplo 3.19, se demostró que el número esperado de ensayos hasta que apare¬ 
ce el primer éxito es l/p, así que el número esperado de fallas hasta que aparece el primer 
éxito es (l/p) — 1 = (1 — p)/p. Intuitivamente, se esperaría ver r • (1 — p)/p fallas antes 
del r-ésimo éxito y éste en realidad es E(X). También existe una fórmula simple para V(X). 


PROPOSICIÓN 


Si X es una variable aleatoria binomial negativa con función masa de probabilidad 
nb(x\ r, p), entonces 


E(X) 


K1 ~ p) 
P 


V(X) 


r( 1 - p) 


Por último, al expandir el coeficiente binomial en frente de p r ( 1 — p) x y haciendo alguna re¬ 
ducción o cancelación, se ve que nb(x; r, p) está bien definido incluso cuando r no es un en¬ 
tero. Se ha encontrado la distribución binomial negativa generalizada para ajustar muy bien 
los datos observados en una amplia variedad de aplicaciones. 


EJERCICIOS Sección 3.5 (68-78) 


68. Un tipo de cámara digital viene en una versión de 3 megapi- 
xeles o una versión de 4 megapixeles. Una tienda de cáma¬ 
ras recibió un envío de 15 de estas cámaras, de las cuales 6 
tienen una resolución de 3 megapixeles. Suponga que se 
seleccionan al azar 5 de estas cámaras para guardarlas detrás 
del mostrador; las otras 10 se colocan en una bodega. Sea 
X = el número de cámaras de 3 megapixeles entre las 5 se¬ 
leccionadas para guardarlas detrás del mostrador. 

a. ¿Qué distribución tiene X (nombre y valores de todos los 
parámetros)? 

b. Calcule P(X = 2), P(X < 2) y P(X > 2). 

c. Calcule el valor medio y la desviación estándar de X. 

69. Cada uno de 12 refrigeradores de un tipo ha sido regresado 
a un distribuidor debido a un ruido agudo audible producido 
por oscilación cuando el refrigerador está funcionando. Su¬ 
ponga que 7 de estos refrigeradores tienen un compresor de¬ 
fectuoso y que los otros 5 tienen problemas menos serios. Si 
los refrigeradores se examinan en orden aleatorio, sea X el 
número entre los primeros 6 examinados que tienen un com¬ 
presor defectuoso. Calcule lo siguiente: 

a. P(X = 5) 

b. P(X < 4) 

c. La probabilidad de que X exceda su valor medio por más 
de una desviación estándar. 

d. Considere un gran envío de 400 refrigeradores, 40 de los 
cuales tienen compresores defectuosos. Si X es el núme¬ 
ro entre 15 refrigeradores seleccionados al azar que tie¬ 
nen compresores defectuosos, describa una forma menos 
tediosa de calcular (por lo menos de forma aproximada) 
P(X £ 5) que utilizar la función masa de probabilidad hi- 
pergeométrica. 

70. Un instructor que impartió dos secciones de estadística de 
ingeniería el semestre pasado, la primera con 20 estudiantes 
y la segunda con 30, decidió asignar un proyecto semestral. 
Una vez que todos los proyectos le fueron entregados, el ins¬ 
tructor los ordenó al azar antes de calificarlos. Considere los 
primeros 15 proyectos calificados. 


a. ¿Cuál es la probabilidad de que exactamente 10 de estos 
sean de la segunda sección? 

b. ¿Cuál es la probabilidad de que por lo menos 10 de estos 
sean de la segunda sección? 

c. ¿Cuál es la probabilidad de que por lo menos 10 de estos 
sean de la misma sección? 

d. ¿Cuáles son el valor medio y la desviación estándar del 
número entre estos 15 que son de la segunda sección? 

e. ¿Cuáles son el valor medio y la desviación estándar del 
número de proyectos que no están entre estos primeros 15 
que son de la segunda sección? 

71. Un geólogo recolectó 10 especímenes de roca basáltica y 10 
especímenes de granito. Él le pide a su ayudante de labora¬ 
torio que seleccione al azar 15 de los especímenes para ana¬ 
lizarlos. 

a. ¿Cuál es la función masa de probabilidad del número 
de especímenes de granito seleccionados para su aná¬ 
lisis? 

b. ¿Cuál es la probabilidad de que todos los especímenes de 
uno de los dos tipos de roca sean seleccionados para su 
análisis? 

c. ¿Cuál es la probabilidad de que el número de especíme¬ 
nes de granito seleccionados para analizarlos esté dentro 
de una desviación estándar de su valor medio? 

72. Un director de personal que va a entrevistar a 11 ingenieros 
para cuatro vacantes de trabajo ha programado seis entrevis¬ 
tas para el primer día y cinco para el segundo. Suponga que 
los candidatos son entrevistados en orden aleatorio. 

a. ¿Cuál es la probabilidad que x de los cuatro mejores can¬ 
didatos sean entrevistados el primer día? 

b. ¿Cuántos de los mejores cuatro candidatos se espera que 
puedan ser entrevistados el primer día? 

73. Veinte parejas de individuos que participan en un torneo de 
bridge han sido sembrados del 1, . . . , 20. En esta primera 
parte del torneo, los 20 son divididos al azar en 10 parejas 
este-oeste y 10 parejas norte-sur. 
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a. ¿Cuál es la probabilidad de que x de las 10 mejores pare¬ 
jas terminen jugando este-oeste? 

b. ¿Cuál es la probabilidad de que las cinco mejores parejas 
terminen jugando en la misma dirección? 

c. Si existen 2 n parejas, ¿cuál es la función masa de proba¬ 
bilidad de X — el número entre las mejores n parejas que 
terminan jugando este-oeste? ¿Cuáles son E{X) y V(X)7 

74. Una alerta contra el esmog de segunda etapa ha sido emiti¬ 
da en una área del condado de Los Ángeles en la cual hay 50 
firmas industriales. Un inspector visitará 10 firmas seleccio¬ 
nadas al azar para ver si no han violado los reglamentos. 

a. Si 15 de las firmas sí están violando por lo menos un re¬ 
glamento, ¿cuál es la función masa de probabilidad del 
número de firmas visitadas por el inspector que violan 
por lo menos un reglamento? 

b. Si existen 500 firmas en el área, 150 de las cuales violan 
algún reglamento, represente de forma aproximada la 
función masa de probabilidad del inciso a) con una fun¬ 
ción masa de probabilidad más simple. 

c. Con X = el número entre las 10 visitadas que violan al¬ 
gún reglamento, calcule E(X) y V(X) ambas para la fun¬ 
ción masa de probabilidad exacta y función masa de 
probabilidad aproximada del inciso b). 
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75. Suponga que p = /'(nacimiento de un varón) = 0.5. Una pa¬ 
reja desea tener exactamente dos niñas en su familia. Ten¬ 
drán hijos hasta que esta condición se satisfaga. 

a. ¿Cuál es la probabilidad de que la familia tenga x varones? 

b. ¿Cuál es la probabilidad de que la familia tenga cuatro 
hijos? 

c. ¿Cuál es la probabilidad de que la familia tenga cuando 
mucho cuatro hijos? 

d. ¿Cuántos varones cree que tenga esta familia? ¿Cuántos 
hijos esperaría que tenga esta familia? 

76. Una familia decide tener hijos hasta que tengan tres del mismo 
sexo. Suponiendo P(B ) = P(G) = 0.5, ¿cuál es la función ma¬ 
sa de probabilidad de X = el número de hijos en la familia? 

77. Tres hermanos y sus esposas deciden tener hijos hasta que 
cada familia tenga dos niñas. ¿Cuál es la función masa de 
probabilidad de X = el número total de varones procreados 
por los hermanos? ¿Cuál es E(X) y cómo se compara con el 
número esperado de varones procreados por cada hermano? 

78. El individuo A tiene un dado rojo y el B uno verde (ambos 
imparciales). Si cada uno los lanza hasta que obtiene cinco 
“dobles” (1 — 1, . . . , 6 —6), ¿cuál es la función masa de pro¬ 
babilidad de X = el número total de veces que un dado es 
lanzado? ¿Cuáles son E(X) y V{X)7 


3.6 Distribución de probabilidad de Poisson 


Las distribuciones binomiales, hipergeométricas y binomiales negativas se derivaron par¬ 
tiendo de un experimento compuesto de ensayos o sorteos y aplicando las leyes de probabi¬ 
lidad a varios resultados del experimento. No existe un experimento simple en el cual esté 
basada la distribución de Poisson, aun cuando en breve se describirá cómo puede ser obte¬ 
nida mediante ciertas operaciones restrictivas. 


DEFINICIÓN 


Se dice que una variable aleatoria X tiene una distribución de Poisson con paráme¬ 
tro A (A. > 0) si la función masa de probabilidad de X es 

e A A l 

p(x; A) = - x = 0, 1,2,... 

x\ 


El valor de A es con frecuencia un valor por unidad de tiempo o por unidad de área. 
La letra e en p(x; A) representa la base del sistema de logaritmos naturales; su valor numé¬ 
rico es aproximadamente 2.71828. Como A debe ser positiva, p(x; A) > 0 con todos los va¬ 
lores posibles x. El hecho de que E” =0 p(x; A) = 1 es una consecuencia de la expansión de 
la serie infinita de Maclaurin de e k , la cual aparece en la mayoría de los textos de cálculo: 

A 2 A 3 ^5 A* 

e A = 1 + A H-1-f • • • = Y — (3.19) 

2! 3! "o*! 

Si los dos términos extremos de la expresión (3.19) se multiplican por e 3 y luego e Á se 
coloca adentro de la suma, el resultado es 


i=2 


x=0 


A* 

x! 


lo que demuestra que p(x\ A) satisface la segunda condición necesaria para especificar una 
función masa de probabilidad. 
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Ejemplo 3.39 


PROPOSICIÓN 


Ejemplo 3.40 


Sea X el número de criaturas de un tipo particular capturadas en una trampa durante un 
periodo determinado. Suponga que X tiene una distribución de Poisson con A = 4.5, así que 
en promedio las trampas contendrán 4.5 criaturas [El artículo “Dispersal Dynamics of the 
Bivalve Gemina Gemina in a Patchy Environment ( EcologicalMonographs, 1995: 1-20) su¬ 
giere este modelo: el molusco bivalvo Gemina gemina es una pequeña almeja.] La probabi¬ 
lidad de que una trampa contenga exactamente cinco criaturas es 

e~ 4 - 5 (4 5) 5 

P(X = 5) = - = 0.1708 

5! 


La probabilidad de que una trampa contenga cuando mucho cinco criaturas es 


5 f>- 4 -5(4 syt 

P(X < 5) = £ - = e 4 - 5 


x=0 


XI 


l + 4.5 + ^ + 
2 ! 


(4.5) 5 

5! 


= 0.7029 


La distribución de Poisson como límite 

La siguiente proposición proporciona el razonamiento para utilizar la distribución de Pois¬ 
son en muchas situaciones. 


Suponga que en la función masa de probabilidad binomial b(x\ n, p ), si « —» “ y 
p —* 0 de tal modo que np tienda a un valor A > 0. Entonces b{x; n, p) —* p(x\ A). 


De acuerdo con esta proposición, en cualquier experimento binomial en el cual n es 
grande y p es pequeña, b(x; n, p) ~ p(x; A), donde A= np. Como regla empírica, esta apro¬ 
ximación puede ser aplicada con seguridad si n > 50 y np < 5. 

Si un editor de libros no técnicos hace todo lo posible porque sus libros estén libres de erro¬ 
res tipográficos, de modo que la probabilidad de que cualquier página dada contenga por lo 
menos uno de esos errores es de 0.005 y los errores son independientes de una página a otra, 
¿cuál es la probabilidad de que una de sus novelas de 400 páginas contenga exactamente una 
página con errores? ¿Cuándo mucho tres páginas con errores? 

Con S denotando una página que contiene por lo menos un error y F una página libre 
de errores, el número X de páginas que contienen por lo menos un error es una variable alea¬ 
toria binomial con n = 400 y p = 0.005, así que np = 2. Se desea 

P(X = 1) = b( 1; 400, 0.005) « p( 1; 2) = = 0.270671 

El valor binomial es £>( 1; 400, 0.005) = 0.270669, así que la aproximación es muy buena. 
Asimismo 

3 3 

P(X < 3) « 2 p(x, 2) = Ze~ 2 ^- 

x=0 x=0 x - 

= 0.135335 + 0.270671 + 0.270671 + 0.180447 
= 0.8571 

y éste de nuevo se aproxima bastante al valor binomial P(X < 3) = 0.8576. ■ 

La tabla 3.2 muestra la distribución de Poisson con A = 3 junto con las tres distribu¬ 
ciones binomiales con np = 3 y la figura 3.8 (generada por S-Plus) ilustra una gráfica de la 
distribución de Poisson junto con las dos primeras distribuciones binomiales. La aproxima¬ 
ción es de uso limitado con n = 30, pero desde luego la precisión es mejor con n = 100 y 
mucho mejor con n = 300. 
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Tabla 3.2 Comparación de la distribución de Poisson con tres distribuciones 
binomiales 


X 

n = 30, p = 0.1 

n = 100, p = 0.03 

n = 300, p = 0.01 

Poisson, A = 3 

0 

0.042391 

0.047553 

0.049041 

0.049787 

i 

0.141304 

0.147070 

0.148609 

0.149361 

2 

0.227656 

0.225153 

0.224414 

0.224042 

3 

0.236088 

0.227474 

0.225170 

0.224042 

4 

0.177066 

0.170606 

0.168877 

0.168031 

5 

0.102305 

0.101308 

0.100985 

0.100819 

6 

0.047363 

0.049610 

0.050153 

0.050409 

7 

0.018043 

0.020604 

0.021277 

0.021604 

8 

0.005764 

0.007408 

0.007871 

0.008102 

9 

0.001565 

0.002342 

0.002580 

0.002701 

10 

0.000365 

0.000659 

0.000758 

0.000810 




Figura 3.8 Comparación de una distribución de Poisson con dos distribuciones binomiales. 

La tabla A.2 del apéndice muestra la función de distribución acumulativa F(x\ A) 
para A = 0.1, 0.2, .... 1, 2, ..., 10, 15 y 20. Por ejemplo, si A = 2 entonces P(X < 3) = 
F( 3; 2) = 0.857 como en el ejemplo 3.40, en tanto que P(X = 3) = F( 3; 2) — F( 2; 2) = 0.180. 
Alternativamente, muchos paquetes de computadora estadísticos generarán p(x; A) y F(x\ A) 
al solicitarlo. 

Media y varianza de X 

Como b(x: n, p ) —» p(x\ Aja medida que n -* °°, p -» 0, np -> A, la media y varianza de una 
variable binomial deberán aproximarse a las de una variable de Poisson. Estos límites son 
np —> A y np(\ — p) —> A. 


PROPOSICIÓN 


Si X tiene una distribución de Poisson con parámetro A, entonces E(X) = V(X) = A. 


Estos resultados también pueden ser derivados directamente de la definición de media y va¬ 
rianza. 


Ejemplo 3.41 Tanto el número esperado de criaturas atrapadas como la varianza de éste son iguales a 4.5, 
(continuación del y <r x = Va = VÍ5 = 2.12. ■ 

ejemplo 3.39) 
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Proceso de Poisson 

Una aplicación muy importante de la distribución de Poisson surge en conexión con la ocu¬ 
rrencia de eventos de algún tipo en el transcurso del tiempo. Eventos de interés podrían ser 
visitas a un sitio web particular, pulsos de alguna clase registrados por un contador, mensa¬ 
jes de correo electrónico enviados a una dirección particular, accidentes en una instalación 
industrial o lluvias de rayos cósmicos observados por astrónomos en un observatorio par¬ 
ticular. Se hace la siguiente suposición sobre la forma en que los eventos de interés ocurren: 

1. Existe un parámetro a > 0 de tal modo que durante cualquier intervalo de tiempo corto 
Ai, la probabilidad de que ocurra exactamente un evento es a • Ai + o(Aí).* 

2. La probabilidad de que ocurra más de un evento durante Ai es o(Ai) [la que junto con 
la suposición 1, implica que la probabilidad de cero eventos durante Ai es 1 — a • 
Ai - o(Ai)]. 

3. El número de eventos ocurridos durante este intervalo de tiempo Ai es independiente del 
número ocurrido antes de este intervalo de tiempo. 

Informalmente, la suposición 1 dice que durante un corto intervalo de tiempo, la probabili¬ 
dad de que ocurra un solo evento es aproximadamente proporcional a la duración del inter¬ 
valo de tiempo, donde a es la constante de proporcionalidad. Ahora sea P k (t) la probabilidad 
de que k eventos serán observados durante cualquier intervalo de tiempo particular de dura¬ 
ción t. 



PROPOSICIÓN 


P k {t) = e c “ • ( at) k /k \, de modo que el número de eventos durante un intervalo de 
tiempo de duración t es una variable de Poisson con parámetro A = at. El número es¬ 
perado de eventos durante cualquier intervalo de tiempo es entonces at, así que el nú¬ 
mero esperado durante un intervalo de tiempo unitario es a. 



La ocurrencia de eventos en el transcurso del tiempo como se describió se llama proceso de 
Poisson ; el parámetro a especifica el ritmo del proceso. 

Ejemplo 3.42 Suponga que llegan pulsos a un contador a un ritmo promedio de seis por minuto, así que 
a = 6. Para determinar la probabilidad de que en un intervalo de 0.5 min se reciba por lo 
menos un pulso, obsérvese que el número de pulsos en ese intervalo tiene una distribución 
de Poisson con parámetro at = 6(0.5) = 3 (se utiliza 0.5 min porque a está expresada co¬ 
mo ritmo por minuto). Entonces con X = el número de pulsos recibidos en el intervalo de 
30 segundos, 

<r 3 (3)° 

P(l < X) = 1 - P(X = 0) = 1 - ^ = 0.950 ■ 

En lugar de observar eventos en el transcurso del tiempo, considere observar eventos 
de algún tipo que ocurren en una región de dos o tres dimensiones. Por ejemplo, se podría 
seleccionar un mapa de una región R de un bosque, ir a dicha región y contar el número de 
árboles. Cada árbol representaría un evento que ocurre en un punto particular del espacio. 
Conforme a suposiciones similares a 1-3, se puede demostrar que el número de eventos que 
ocurren en una región R tiene una distribución de Poisson con parámetro a • a(R), donde 
a(R ) es el área de R. La cantidad a es el número esperado de eventos por unidad de área o 
volumen. 


* Una cantidad es o(Aí) (léase “o minúscula de delta /”) si, a medida que At tiende a cero, también lo hace o(Aí)/Af. 
Es decir, o(Aí) es incluso más insignificante (tiende a 0 más rápido) que A t mismo. La cantidad (Ai) 2 tiene esta pro¬ 
piedad, pero sen(Af) no. 
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EJERCICIOS Sección 3.6 (79-93) 


79. Sea X el número de imperfecciones superficiales de una cal¬ 
dera seleccionada al azar de un tipo que tiene una distribu¬ 
ción de Poisson con parámetro A = 5. Use la tabla A.2 del 
apéndice para calcular las siguientes probabilidades: 

a. P(X < 8) b. P(X = 8) c. P (9 < X) 
d. P(5 < X < 8) e. P(5 < X < 8) 

80. Suponga que el número X de tomados observados en una re¬ 
gión particular durante un año tiene una distribución de 
Poisson con A= 8. 

a. Calcule P(X < 5). 

b. Calcule P(6 < X < 9). 

c. Calcule P(10 < X). 

d. ¿Cuál es la probabilidad de que el número observado de 
tomados sobrepase el número esperado por más de una 
desviación estándar? 

81. Suponga que el número de conductores que viajan entre un 
origen y destino particulares durante un periodo designado 
tiene una distribución de Poisson con parámetro A = 20 (su¬ 
gerido en el artículo “Dynamic Ride Sharing: Theory and 
Practice”, J. ofTransp. Engr., 1997: 308-312). ¿Cuál es la 
probabilidad de que el número de conductores 

a. sea cuando mucho de 10? 

b. sea de más de 20? 

c. sea de entre 10 y 20, inclusive? ¿Sea estrictamente de en¬ 
tre 10 y 20? 

d. esté dentro de dos desviaciones estándar del valor medio? 

82. Considere escribir en un disco de computadora y luego enviar¬ 
lo a través de un certificador que cuenta el número de pulsos 
faltantes. Suponga que este número X tiene una distribución 
de Poisson con parámetro A = 0.2. (Sugerido en “Average 
Sample Nurnber for Semi-Curtailed Sampling Using the Pois¬ 
son Distribution”, J. Quality Technology, 1983: 126-129.) 

a. ¿Cuál es la probabilidad de que un disco tenga exacta¬ 
mente un pulso faltante? 

b. ¿Cuál es la probabilidad de que un disco tenga por lo me¬ 
nos dos pulsos faltantes? 

c. Si seleccionan dos discos independientemente, ¿cuál es la 
probabilidad de que ninguno contenga un pulso faltante? 

83. Un artículo en Los Angeles Times (3 de diciembre de 1993) 
reporta que una de cada 200 personas portan el gen defec¬ 
tuoso que provoca cáncer de colon hereditario. En una 
muestra de 1000 individuos, ¿cuál es la distribución aproxi¬ 
mada del número que porta este gen? Use esta distribución 
para calcular la probabilidad aproximada de que 

a. Entre 5 y 8 (inclusive) porten el gen. 

b. Por lo menos 8 porten el gen. 

84. Suponga que sólo 0.10% de todas las computadoras de cier¬ 
to tipo experimentan fallas del CPU durante el periodo de 
garantía. Considere una muestra de 10 000 computadoras. 

a. ¿Cuáles son el valor esperado y la desviación estándar 
del número de computadoras en la muestra que tienen el 
defecto? 

b. ¿Cuál es la probabilidad (aproximada) de que más de 10 
computadoras muestreadas tengan el defecto? 

c. ¿Cuál es la probabilidad (aproximada) de que ninguna 
computadora muestreada tenga el defecto? 


85. Suponga que una pequeña aeronave aterriza en un aeropuer¬ 
to de acuerdo con un proceso de Poisson con razón a = 8 
por hora de modo que el número de aterrizajes durante un 
periodo de t horas es una variable aleatoria de Poisson con 
parámetro A = 8í. 

a. ¿Cuál es la probabilidad de que exactamente seis aerona¬ 
ves pequeñas aterricen durante un intervalo de una hora? 
¿Por lo menos seis? ¿Por lo menos 10? 

b. ¿Cuáles son el valor esperado y la desviación estándar 
del número de aeronaves pequeñas que aterrizan durante 
un lapso de 90 min? 

c. ¿Cuál es la probabilidad de que por lo menos 20 aerona¬ 
ves pequeñas aterricen durante un lapso de 2^-horas? ¿De 
qué cuando mucho aterricen 10 durante este periodo? 

86. El número de personas que llegan para tratamiento a una 
sala de urgencias puede ser modelado mediante un proceso 
de Poisson con parámetro de razón de cinco por hora. 

a. ¿Cuál es la probabilidad de que ocurran exactamente 
cuatro arribos durante una hora particular? 

b. ¿Cuál es la probabilidad de que por lo menos cuatro per¬ 
sonas arriben durante una hora particular? 

c. ¿Cuántas personas espera que arriben durante un periodo 
de 45 min? 

87. El número de solicitudes de ayuda recibidas por un servicio 
de grúas es un proceso de Poisson con razón a = 4 por hora. 

a. Calcule la probabilidad de que exactamente diez solicitu¬ 
des sean recibidas durante un periodo particular de 2 horas. 

b. Si los operadores del servicio de grúas hacen una pausa 
de 30 min para el almuerzo, ¿cuál es la probabilidad de 
que no dejen de atender llamadas de ayuda? 

c. ¿Cuántas llamadas esperaría durante esta pausa? 

88. Al someter a prueba tarjetas de circuito, la probabilidad de 
que cualquier diodo particular falle es de 0.01. Suponga que 
una tarjeta de circuito contiene 200 diodos. 

a. ¿Cuántos diodos esperaría que fallen y cuál es la desvia¬ 
ción estándar del número que se espera fallen? 

b. ¿Cuál es la probabilidad (aproximada) de que por lo menos 
cuatro diodos fallen en una tarjeta seleccionada al azar? 

c. Si se envían cinco tarjetas a un cliente particular, ¿qué tan 
probable es que por lo menos cuatro de ellas funcionen 
apropiadamente? (Una tarjeta funciona apropiadamente 
sólo si todos sus diodos funcionan.) 

89. El artículo “Reliability-Based Service-Life Assessment of 
Aging Concrete Structures”. (J. Structural Engr., 1993: 
1600-1621) sugiere que un proceso de Poisson puede ser 
utilizado para representar la ocurrencia de cargas estructura¬ 
les en el transcurso del tiempo. Suponga que el tiempo medio 
entre ocurrencias de cargas es de 0.5 al año. 

a. ¿Cuántas cargas se espera que ocurran durante un perio¬ 
do de 2 años? 

b. ¿Cuál es la probabilidad de que ocurran más de cinco 
cargas durante un periodo de 2 años? 

c. ¿Qué tan largo debe ser un periodo de modo que la pro¬ 
babilidad de que no ocurran cargas durante dicho periodo 
sea cuando mucho de 0.1? 
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90. Si X tiene una distribución de Poisson con parámetro A. De¬ 
muestre que E(X) = A derivada directamente de la defini¬ 
ción de valor esperado. [ Sugerencia: El primer término en la 
suma es igual a 0 y luego x puede ser eliminada. Ahora sa¬ 
que como factor a A y demuestre que la suma es uno.] 

91. Suponga que hay árboles distribuidos en un bosque de 
acuerdo con un proceso de Poisson bidimensional con pará¬ 
metro a, el número esperado de árboles por acre es de 80. 

a. ¿Cuál es la probabilidad de que en un terreno de un cuar¬ 
to de acre, haya cuando mucho 16 árboles? 

b. Si el bosque abarca 85 000 acres, ¿cuál es el número es¬ 
perado de árboles en el bosque? 

c. Suponga que selecciona un punto en el bosque y constru¬ 
ye un círculo de 0.1 milla de radio. Sea X = el número de 
árboles dentro de esa región circular. ¿Cuál es la función 
masa de probabilidad de XI [Sugerencia: 1 milla cuadra¬ 
da = 640 acres.] 

92. A una estación de inspección de equipo vehicular llegan au¬ 
tomóviles de acuerdo con un proceso de Poisson con razón 
a = 10 por hora. Suponga que un vehículo que llega con 
probabilidad de 0.5 no tendrá violaciones de equipo. 

a. ¿Cuál es la probabilidad de que exactamente diez lleguen 
durante la hora y que los diez no tengan violaciones? 

b. Con cualquier y S: 10 fija, ¿cuál es la probabilidad de que 
y automóviles lleguen durante la hora, diez de los cuales 
no tengan violaciones? 


c. ¿Cuál es la probabilidad de que lleguen diez carros “sin 
violaciones” durante la siguiente hora? [ Sugerencia : Sume 
la probabilidades en el inciso b) desde y = 10 hasta co.] 

93. a. En un proceso de Poisson, ¿qué tiene que suceder tanto en 
el intervalo de tiempo (0, t) como en el intervalo (f, t + 
Ai) de modo que no ocurran eventos en todo el intervalo 
(0, t + Ai)? Use esto y las suposiciones 1-3 para escribir 
una relación entre P Q (t + Ai) y P 0 (t). 

b. Use el resultado del inciso a) para escribir una expresión 
para la diferencia P 0 (t + Ai) — P 0 (t). Divida entonces en¬ 
tre Ai y permita que Ai —» 0 para obtener una ecuación 
que implique ( d/dt)P 0 (t ), la derivada de P 0 (t) con respec¬ 
to a i. 

c. Verifique que P 0 (t) = e~ M satisface la ecuación del in¬ 
ciso b). 

d. Se puede demostrar de manera similar a los incisos a) y 
b) que P k {f) s debe satisfacer el sistema de ecuaciones di¬ 
ferenciales 

d 

— P k (t) = aP k _ k (f) ~ aP k (t) 
k= 1, 2, 3, . . . 

Verifique que P k (t) = e~ a, (at) k /k\ satisface el sistema. (En 

realidad esta es la única solución.) 


EJERCICIOS SUPLEMENTARIOS (94-122) 


94. Considere un mazo compuesto de siete cartas, marcadas 1, 
2, . . . , 7. Se seleccionan al azar tres de estas cartas. Defina 
una variable aleatoria W como W = la suma de los números 
resultantes y calcule la función masa de probabilidad de W. 
Calcule entonces p y a 2 . [Sugerencia: Considere los resul¬ 
tados sin orden, de modo que (1, 3, 7) y (3, 1, 7) no son re¬ 
sultados diferentes. Entonces existen 35 resultados y pueden 
ser puestos en lista. (Este tipo de variable aleatoria en reali¬ 
dad se presenta en conexión con una prueba de hipótesis lla¬ 
mada prueba de suma de filas de Wilcoxon, en la cual hay 
una muestra x y una muestra y y W es la suma de las filas de 
x en la muestra combinada.)] 

95. Después de barajar un mazo de 52 cartas, un tallador repar¬ 
te 5. Sea X = el número de palos representados en la mano 
de 5 cartas. 

a. Demuestre que la función masa de probabilidad de X es 


X 

1 

2 

3 

4 

p(x) 

0.002 

0.146 

0.588 

0.264 


[Sugerencia: p( 1) = 4P (todas son espadas), p(2) = 6P(sólo 
espadas y corazones con por lo menos una de cada palo) y 
p( 4) = 4P(2 espadas Cl una de cada otro palo).] 
b. Calcule p, o 2 y a. 

96. La variable aleatoria binomial negativa X se definió como el nú¬ 
mero de fallas (F) que preceden al r-ésimo éxito (5). Sea Y — 
el número de ensayos necesarios para obtener el r-ésimo éxito 
(.S). Del mismo modo en que fue derivada la función masa de 
probabilidad, derive la función masa de probabilidad de Y. 


97. De todos los clientes que adquieren abrepuertas de cochera 
automáticas, 75% adquieren el modelo de transmisión por 
cadena. Sea X = el número entre los siguientes 15 compra¬ 
dores que seleccionan el modelo de transmisión por cadena. 

a. ¿Cuál es la función masa de probabilidad de X? 

b. Calcule P(X > 10). 

c. Calcule P(6 < X < 10). 

d. Calcule p y cr 2 . 

e. Si la tienda actualmente tiene en existencia 10 modelos 
de transmisión por cadena y 8 modelos de transmisión 
por flecha, ¿cuál es la probabilidad de que las solicitudes 
de estos 15 clientes puedan ser satisfechas con las exis¬ 
tencias actuales? 

98. Un amigo recientemente planeó un viaje de campamento. 
Tenía dos linternas, una que requería una sola batería de 6 V 
y otra que utilizaba dos baterías de tamaño D. Antes había 
empacado dos baterías de 6 V y cuatro tamaño D en su 
“camper”. Suponga que la probabilidad de que cualquier ba¬ 
tería particular funcione es p y que las baterías funcionan o 
fallan independientemente una de otra. Nuestro amigo desea 
llevar sólo una linterna. ¿Con qué valores de p deberá llevar 
la linterna de 6 V? 

99. Un sistema k de n es uno que funcionará si y sólo si por lo 
menos k de los n componentes individuales en el sistema 
funcionan. Si los componentes individuales funcionan inde¬ 
pendientemente uno de otro, cada uno con probabilidad de 
0.9, ¿cuál es la probabilidad de que un sistema 3 de 5 fun¬ 
cione? 
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100. Un fabricante de baterías para linternas desea controlar la 
calidad de sus productos rechazando cualquier lote en el 
que la proporción de baterías que tienen un voltaje inacep¬ 
table parezca ser demasiado alto. Con esta finalidad, de 
cada lote de 10 000 baterías, se seleccionaron y probarán 
25. Si por lo menos 5 de estas generan un voltaje inacepta¬ 
ble, todo el lote será rechazado. ¿Cuál es la probabilidad de 
que un lote será rechazado si 

a. 5% de las baterías en el lote tienen voltajes inaceptables? 

b. 10% de las baterías en el lote tienen voltajes inacepta¬ 
bles? 

c. 20% de las baterías en el lote tienen voltajes inacepta¬ 
bles? 

d. ¿Qué les sucedería a las probabilidades en los incisos 
a)-c) si el número de rechazo crítico se incrementara de 
5 a 6? 

101. De las personas que pasan a través de un detector de meta¬ 
les en un aeropuerto, el 0.5% lo activan; sea X = el núme¬ 
ro entre un grupo de 500 seleccionado al azar que activan 
el detector. 

a. ¿Cuál es la función masa de probabilidad (aproximada) 
de XI 

b. Calcule P(X = 5). 

c. Calcule P(5 < X). 

102. Una firma consultora educativa está tratando de decidir si 
los estudiantes de preparatoria que nunca antes han utiliza¬ 
do una calculadora de mano pueden resolver cierto tipo de 
problema más fácilmente con una calculadora que utiliza 
lógica polaca inversa o una que no utiliza esta lógica. Se 
selecciona una muestra de 25 estudiantes y se les permite 
practicar con ambas calculadoras. Luego a cada estudiante 
se le pide que resuelva un problema con la calculadora po¬ 
laca inversa y un problema similar con la otra. Sea p = 
P(S), donde S indica que un estudiante resolvió el proble¬ 
ma más rápido con la lógica polaca inversa que sin ella y 
sea X = número de éxitos. 

a. Si p = 0.5, ¿cuál es P(1 < X < 18)? 

b. Si p = 0.8, ¿cuál es P( 7 < X < 18)? 

c. Si la pretensión de que p = 0.5 tiene que ser rechazada 
cuando X £ 7 o X S 18, ¿cuál es la probabilidad de re¬ 
chazar la pretensión cuando en realidad es correcta? 

d. Si la decisión de rechazar la pretensión p = 0.5 se hace 
como en el inciso c), ¿cuál es la probabilidad de que la 
pretensión no sea rechazada cuando p = 0.6? ¿Cuándo 

p = 0.8? 

e. ¿Qué regla de decisión escogería para rechazar la pre¬ 
tensión de que p = 0.5 si desea que la probabilidad en 
el inciso c) sea cuando mucho de 0.01? 

103. Considere una enfermedad cuya presencia puede ser iden¬ 
tificada por medio de un análisis de sangre. Sea p la proba¬ 
bilidad de que un individuo seleccionado al azar tenga la 
enfermedad. Suponga se seleccionan independientemente 
n individuos para analizarlos. Una forma de proceder es 
analizar cada una de las n muestras de sangre. Un proce¬ 
dimiento potencialmente más económico, de análisis en 
grupo se introdujo durante la Segunda Guerra Mundial pa¬ 
ra identificar hombres sifilíticos entre los reclutas. En pri¬ 
mer lugar, se toma una parte de cada muestra de sangre, se 
combinan estos especímenes y se realiza un solo análisis. 
Si ninguno tiene la enfermedad, el resultado será negativo 
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y sólo se requiere un análisis. Si por lo menos un individuo 
está enfermo, el análisis de la muestra combinada dará un 
resultado positivo, en cuyo caso se realizan los análisis de 
los n individuos. Sip = 0.1 y n = 3, ¿cuál es el número es¬ 
perado de análisis si se utiliza este procedimiento? ¿Cuál 
es el número esperado cuando n = 5? [El artículo “Ran- 
dom Múltiple-Access Communication and Group Testing” 
(IEEE Trans. on Commun., 1984: 769-774) aplicó estas 
ideas a un sistema de comunicación en el cual la dicotomía 
fue usuario ocioso/activo en lugar de enfermo/no enfermo.] 

104. Sea p l la probabilidad de que cualquier símbolo de código 
particular sea erróneamente transmitido a través de un 
sistema de comunicación. Suponga que en diferentes sím¬ 
bolos, ocurren errores de manera independiente uno de 
otro. Suponga también que con probabilidad p 2 un símbo¬ 
lo erróneo es corregido al ser recibido. Sea X el número de 
símbolos correctos en un bloque de mensaje compuesto 
de n símbolos (una vez que el proceso de corrección ha ter¬ 
minado). ¿Cuál es la distribución de probabilidad de XI 

105. El comprador de una unidad generadora de potencia requie¬ 

re de arranques consecutivos exitosos antes de aceptar la uni¬ 
dad. Suponga que los resultados de arranques individuales 
son independientes entre sí. Sea p la probabilidad de que 
cualquier arranque particular sea exitoso. La variable aleato¬ 
ria de interés es X = el número de arranques que deben ha¬ 
cerse antes de la aceptación. Dé la función masa de 
probabilidad de X en el caso c = 2. Si p — 0.9, ¿cuál es P(X 
£ 8)? [Sugerencia'. Conx2 5, exprese p(x) “recursivamen¬ 
te” en términos de la función masa de probabilidad evalua¬ 
da con los valores más pequeños x — 3, x — 4, 2.\ 

(Este problema fue sugerido del artículo “Evaluation of a 
Start-Up Demonstration Test”, J. Ouality Technology , 
1983: 103-106.) 

106. Una aerolínea ha desarrollado un plan para un club de via¬ 
jeros ejecutivos sobre la premisa de que 10% de sus clien¬ 
tes actuales calificarían para membresía. 

a. Suponiendo la validez de esta premisa, entre 25 clientes 
actuales seleccionados al azar, ¿cuál es la probabilidad 
de que entre 2 y 6 (inclusive) califiquen para membresía? 

b. De nuevo suponiendo la validez de la premisa, ¿cuál es 
el número esperado de clientes que califican y la desvia¬ 
ción estándar del número que califica en una muestra 
aleatoria de 100 clientes actuales? 

c. Sea X el número en una muestra al azar de 25 clientes 
actuales que califican para membresía. Considere recha¬ 
zar la premisa de la compañía a favor de la pretensión 
de que p > 0.10 si x S 7. ¿Cuál es la probabilidad de 
que la premisa de la compañía sea rechazada cuando en 
realidad es válida? 

d. Remítase a la regla de decisión introducida en el inciso 
c). ¿Cuál es la probabilidad de que la premisa de la 
compañía no sea rechazada aun cuando p — 0.20 (es de¬ 
cir, 20% califican)? 

107. 40% de las semillas de mazorcas de maíz (maíz moderno) 
portan sólo una espiga y el 60% restante portan dos espigas. 
Una semilla con una espiga producirá una mazorca con es¬ 
pigas únicas 29% del tiempo, en tanto que una semilla con 
dos espigas producirán una mazorca con espigas únicas 
26% del tiempo. Considere seleccionar al azar diez semillas. 
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128 CAPÍTULO 3 Variables aleatorias discretas y distribuciones de probabilidad 


a. ¿Cuál es la probabilidad de que exactamente cinco de es¬ 
tas semillas porten una sola espiga y de que produzcan 
una mazorca con una sola espiga? 

b. ¿Cuál es la probabilidad de que exactamente cinco de 
estas mazorcas producidas por estas semillas tengan es¬ 
pigas únicas? ¿Cuál es la probabilidad de que cuando 
mucho cinco mazorcas tengan espigas únicas? 

108. Un juicio terminó con el jurado en desacuerdo porque ocho 
de sus miembros estuvieron a favor de un veredicto de cul¬ 
pabilidad y los otros cuatro estuvieron a favor de la abso¬ 
lución. Si los jurados salen de la sala en orden aleatorio y 
cada uno de los primeros cuatro que salen de la sala es aco¬ 
sado por un reportero para entrevistarlo, ¿cuál es la función 
masa de probabilidad de X = el número de jurados a favor 
de la absolución entre los entrevistados? ¿Cuántos de los 
que están a favor de la absolución espera que sean entrevis¬ 
tados? 

109. Un servicio de reservaciones emplea cinco operadores de 
información que reciben solicitudes de información inde¬ 
pendientemente uno de otro, cada uno de acuerdo con un 
proceso de Poisson con razón a = 2 por minuto. 

a. ¿Cuál es la probabilidad de que durante un periodo de 
un min dado, el primer operador no reciba solicitudes? 

b. ¿Cuál es la probabilidad de que durante un periodo de 
un min dado, exactamente cuatro de los cinco operado¬ 
res no reciban solicitudes? 

c. Escriba una expresión para la probabilidad de que du¬ 
rante un periodo de un min dado, todos los operadores 
reciban exactamente el mismo número de solicitudes. 

110. En un gran campo se distribuyen al azar las langostas de 
acuerdo con una distribución de Poisson con parámetro 
a = 2 por yarda cuadrada. ¿Qué tan grande deberá ser el 
radio R de una región de muestreo circular para que la pro¬ 
babilidad de hallar por lo menos una en la región sea igual 
a 0.99? 

111. Un puesto de periódicos ha pedido cinco ejemplares de 
cierto número de una revista de fotografía. Sea X = el nú¬ 
mero de individuos que vienen a comprar esta revista. Si X 
tiene una distribución de Poisson con parámetro A = 4, 
¿cuál es el número esperado de ejemplares que serán ven¬ 
didos? 

112. Los individuos A y B comienzan a jugar una secuencia de 
partidas de ajedrez. Sea S = {A gana un juego) y suponga 
que los resultados de juegos sucesivos son independientes 
con P(S) = p y P(F) = 1 — p (nunca empatan). Jugarán 
hasta que uno de ellos gane diez juegos. Sea X = el núme¬ 
ro de partidas jugadas (con posibles valores 10, 11, ... , 
19). 

a. Con x = 10, 11, ... , 19, obtenga una expresión para 
P(x) = P(X = x). 

b. Si un empate es posible, con p = P(S), q = P(F), 1 — 
p — q = P(empate), ¿cuáles son los posibles valores de 
X? ¿Cuál es P(20 < X)? [ Sugerencia : P(20 < X) = 1 - 
P(X < 20).] 

113. Un análisis para detectar la presencia de una enfermedad 
tiene una probabilidad de 0.20 de dar un resultado falso po¬ 
sitivo (lo que indica que un individuo tiene la enfermedad 
cuando éste no es el caso) y una probabilidad de 0.10 de 


dar un resultado falso negativo. Suponga que diez individuos 
son analizados, cinco de los cuales tienen la enfermedad y 
cinco de los cuales no. Sea X = el número de lecturas posi¬ 
tivas que resultan. 

a. ¿Tiene X una distribución binomial? Explique su razo¬ 
namiento. 

b. ¿Cuál es la probabilidad de que exactamente tres de 
diez resultados sean positivos? 

114. La función masa de probabilidad binomial negativa gene¬ 
ralizada está dada por 

nb{x\ r, p) = k(r, x) • p'\ 1 — p) x 

x = 0, 1,2,... 

Sea X el número de plantas de cierta especie encontrada en 
una región particular y tenga esta distribución con p = 0.3 y 
r = 2.5. ¿Cuál es P(X = 4)? ¿Cuál es la probabilidad de 
que por lo menos se encuentre una planta? 

115. Defina una función p{x\ A, p) mediante 



0 de lo contrario 

a. Demuestre que p{x\ A, /a) satisface las dos condiciones 
necesarias para especificar una función masa de proba¬ 
bilidad. [Nota: Si una firma emplea dos mecanógrafos, 
uno de los cuales comete errores tipográficos a razón de 
A por página y el otro a razón de p por página y cada 
uno ellos realiza la mitad del trabajo de mecanografía 
de la firma, entonces p{x\ A, p) es la función masa de 
probabilidad de X = el número de errores en una pági¬ 
na escogida al azar.) 

b. Si el primer mecanógrafo (razón A) teclea 60% de todas 
las páginas, ¿cuál es la función masa de probabilidad de 
X del inciso a)? 

c. ¿Cuál es E(X) para p(x: A. p) dada por la expresión mos¬ 
trada? 

d. ¿Cuál es a 2 para p(x\ A, p) dada por esta expresión? 

116. La moda de una variable aleatoria discreta X con función 
masa de probabilidad p(x) es ese valor x ’ con el cual p(x) 
alcanza su valor más grande (el valor x más probable). 

a. Sea X ~ Bin(n, p). Considerando la razón b(x + 1; n, 
p)/b(x', n, p), demuestre que b(x\ n, p) se incrementa con 
x en tanto x < np — (1 — p). Concluya que el modo x* 
es el entero que satisface (n + \)p — 1 £ x ^ (n + 1 )p. 

b. Demuestre que si X tiene una distribución de Poisson 
con parámetro A, la moda es el entero más grande me¬ 
nor que A. Si A es un entero, demuestre que tanto A — 1 
como A son modas. 

117. Un disco duro de computadora tiene diez pistas concéntri¬ 
cas, numeradas 1, 2, . . . , 10 desde la más externa hasta la 
más interna y un solo brazo de acceso. Sea p¡ = la proba¬ 
bilidad de que cualquier solicitud particular de datos hará 
que el brazo se vaya a la pista i (i = 1, ■ • • , 10. Supon¬ 
ga que las pistas accesadas en búsquedas sucesivas son in¬ 
dependientes. Sea X = el número de pistas sobre las cuales 
pasa el brazo de acceso durante dos solicitudes sucesivas 
(excluida la pista que el brazo acaba de dejar, así que los 
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valores posibles son x = 0, 1, . . . , 9). Calcule la función 
masa de probabilidad de X [Sugerencia: P(el brazo 
está ahora sobre la pista i y X = j) = P(X = j | el 
brazo está ahora sobre i) • p¡. Una vez que se escribe la 
probabilidad condicional en función de p v . . . , p ¡0 , me¬ 
diante la ley de la probabilidad total, se obtiene la probabi¬ 
lidad deseada sumando a lo largo de i. ] 

118. Si X es una variable aleatoria hipergeométrica demuestre 
directamente con la definición que E(X) = nMÍN (conside¬ 
re sólo el caso n < M). [ Sugerencia: Saque como factor a 
nMÍN de la suma para E(X) y demuestre que los términos 
adentro de la suma son de la forma h(y\ n — 1 , M — 1, 
N — 1) donde y = x — 1.] 

119. Use el hecho de que 

2 (x~ p.) 2 p(x) £ 2 (* - ix) 2 p(x) 

todos x x: I x—n | ~^k(r 

para comprobar la desigualdad de Chebyshev dada en el 
ejercicio 44. 

120. El proceso de Poisson simple de la sección 3.6 está carac¬ 
terizado por una razón constante a la cual los eventos ocu¬ 
rren por unidad de tiempo. Una generalización de esto es 
suponer que la probabilidad de que ocurra exactamente un 
evento en el intervalo [t, t + Ai] es ct(t) • A t + o(Ai). Se 
puede demostrar entonces que el número de eventos que 
ocurren durante un intervalo [f¡, í,] tiene una distribución 
de Poisson con parámetro 



La ocurrencia de eventos en el transcurso del tiempo en esta 
situación se llama proceso de Poisson no homogéneo. El 
artículo “Inference Based on Retrospective Ascertain- 
ment”, J. Amer. Stat. Assoc., 1989: 360-372, considera la 
función de intensidad 

a(t) = e a+bl 

en su forma apropiada para eventos que implican la trans¬ 
misión VIH (el virus del SIDA) vía transfusiones sanguí¬ 
neas. Suponga que a = 2 y b = 0.6 (cercanos a los valores 
sugeridos en el artículo), con el tiempo en años, 
a. ¿Cuál es el número esperado de eventos en el intervalo 
[0, 4?]? ¿En [2, 6]? 
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b. ¿Cuál es la probabilidad de que cuando mucho ocurran 
15 eventos en el intervalo [0, 0.9907]? 

121. Considere un conjunto de A 1; . . . , A k de eventos mutua¬ 
mente excluyentes y exhaustivos y una variable aleatoria X 
cuya distribución depende de cuál de los eventos A¡ ocurra 
(p. ej., un viajero abonado podría seleccionar una de tres 
rutas posibles de su casa al trabajo, con X como el tiempo 
de recorrido). Sea E(X | A¡) el valor esperado de X dado que 
el evento A¡ ocurre. Entonces se puede demostrar que E{X) 
= 2 E (X | A¡) ? P(A¡) el promedio ponderado de las “expec¬ 
tativas condicionales” individuales donde las ponderacio¬ 
nes son las probabilidades de la división de eventos. 

a. La duración esperada de una llamada de voz a un núme¬ 
ro telefónico particular es de 3 minutos, mientras que la 
duración esperada de una llamada de datos a ese mismo 
número es de 1 minuto. Si 75% de las llamadas son de 
voz, ¿cuál es la duración esperada de la siguiente lla¬ 
mada? 

b. Una pastelería vende tres diferentes tipos de galletas 
con briznas de chocolate. El número de briznas de cho¬ 
colate en un tipo de galleta tiene una distribución de 
Poisson con parámetro A ¡ = i + 1 (i = 1, 2, 3). Si 20% 
de todos los clientes que compran una galleta con briz¬ 
nas de chocolate selecciona el primer tipo, 50% elige el 
segundo tipo y el 30% restante opta por el tercer tipo, 
¿cuál es el número esperado de briznas en una galleta 
comprada por el siguiente cliente? 

122. Considere una fuente de comunicaciones que transmite pa¬ 
quetes que contienen lenguaje digitalizado. Después de cada 
transmisión, el receptor envía un mensaje que indica si 
la transmisión fue exitosa o no. Si una transmisión no es 
exitosa, el paquete es reenviado. Suponga que el paquete de 
voz puede ser transmitido un máximo de 10 veces. Supo¬ 
niendo que los resultados de transmisiones sucesivas son 
independientes una de otra y que la probabilidad de que 
cualquier transmisión particular sea exitosa es p, determine 
la función masa de probabilidad de la variable aleatoria 
X = el número de veces que un paquete es transmitido. 
Luego obtenga una expresión para el número de veces es¬ 
perado que un paquete es transmitido. 


rales de distribuciones discretas y continuas como los resulta¬ 
dos para distribuciones específicas. 

Ross, Sheldon, Introduction to Probability Models (7a. ed.), Aca- 
demic Press, Nueva York, 2003. Una fuente de material sobre 
el proceso de Poisson y generalizaciones y una amena intro¬ 
ducción a otros temas de probabilidad aplicada. 
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4 


Variables aleatorias 
continuas y distribuciones 
de probabilidad 


INTRODUCCIÓN 


El capítulo 3 se concentró en el desarrollo de distribuciones de probabilidad de varia¬ 
bles aleatorias discretas. En este capítulo se estudia el segundo tipo general de variable 
aleatoria que se presenta en muchos problemas aplicados. Las secciones 4.1 y 4.2 
presentan las definiciones y propiedades básicas de las variables aleatorias continuas 
y sus distribuciones de probabilidad. En la sección 4.3, se estudia en detalle la varia¬ 
ble aleatoria normal y su distribución, sin duda la más importante y útil en la proba¬ 
bilidad y estadística. Las secciones 4.4 y 4.5 se ocupan de otras distribuciones 
continuas utilizadas con frecuencia en trabajo aplicado. En la sección 4.6, se introdu¬ 
ce un método de evaluar si un dato muestral es compatible con una distribución es¬ 
pecificada. 


O 
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4.1 Funciones de densidad de probabilidad 


Una variable aleatoria (va) discreta es una cuyos valores posibles o constituyen un conjun¬ 
to finito o bien pueden ser puestos en lista en una secuencia infinita (una lista en la cual exis¬ 
te un primer elemento, un segundo elemento, etc.). Una variable aleatoria cuyo conjunto de 
valores posibles es un intervalo completo de números no es discreta. 

Recuérdese de acuerdo con el capítulo 3 que una variable aleatoria X es continua si 
1) sus valores posibles comprenden un solo intervalo sobre la línea de numeración (para al¬ 
guna A < B, cualquier número x entre A y B es un valor posible) o una unión de intervalos 
disjuntos y 2) P(X = c) = 0 para cualquier número c que sea un valor posible de X. 

Ejemplo 4.1 En el estudio de la ecología de un lago, se mide la profundidad en lugares seleccionados, 
entonces X = la profundidad en ese lugar es una variable aleatoria continua. En este caso A 
es la profundidad mínima en la región muestreada y B es la profundidad máxima. ■ 

Ejemplo 4.2 Si se selecciona al azar un compuesto químico y se determina su pH X, entonces X es una 
variable aleatoria continua porque cualquier valor pH entre 0 y 14 es posible. Si se conoce 
más sobre el compuesto seleccionado para su análisis, entonces el conjunto de posibles va¬ 
lores podría ser un subintervalo de [0, 14], tal como 5.5 < x < 6.5 pero X seguiría siendo 
continua. ■ 

Ejemplo 4.3 Sea X la cantidad de tiempo que un cliente seleccionado al azar pasa esperando que le cor¬ 
ten el pelo antes de que comience su corte de pelo. El primer pensamiento podría ser que X 
es una variable aleatoria continua, puesto que se requiere medirla para determinar su valor. 
Sin embargo, existen clientes suficientemente afortunados que no tienen que esperar antes 
de sentarse en el sillón del peluquero. Así que el caso debe ser P(X = 0) > 0. Condicional 
en cuanto a los sillones vacíos, aun cuando, el tiempo de espera será continuo puesto que X 
podría asumir entonces cualquier valor entre un tiempo mínimo posible A y un tiempo má¬ 
ximo posible B. Esta variable aleatoria no es ni puramente discreta ni puramente continua 
sino que es una mezcla de los dos tipos. ■ 

Se podría argumentar que aunque en principio las variables tales como altura, peso y 
temperatura son continuas, en la práctica las limitaciones de los instrumentos de medición 
nos restringen a un mundo discreto (aunque en ocasiones muy finamente subdividido). Sin 
embargo, los modelos continuos a menudo representan muy bien de forma aproximada si¬ 
tuaciones del mundo real y con frecuencia es más fácil trabajar con matemáticas continuas 
(el cálculo) que con matemáticas de variables discretas y distribuciones. 

Distribuciones de probabilidad de variables continuas 

Supóngase que la variable X de interés es la profundidad de un lago en un punto sobre la su¬ 
perficie seleccionado al azar. Sea M = la profundidad máxima (en metros), así que cual¬ 
quier número en el intervalo [0, M] es un valor posible de X. Si se “discretiza” X midiendo 
la profundidad al metro más cercano, entonces los valores posibles son enteros no negativos 
menores que o iguales a M. La distribución discreta resultante de profundidad se ilustra con 
un histograma de probabilidad. Si se traza el histograma de modo que el área del rectángu¬ 
lo sobre cualquier entero posible k sea la proporción del lago cuya profundidad es (al me¬ 
tro más cercano) k, entonces el área total de todos los rectángulos es 1. En la figura 4.1a) 
aparece un posible histograma. 

Si se mide la profundidad con mucho más precisión y se utiliza el mismo eje de me¬ 
dición de la figura 4.1a), cada rectángulo en el histograma de probabilidad resultante es mu¬ 
cho más angosto, aun cuando el área total de todos los rectángulos sigue siendo 1. En la 
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figura 4.1b) se ilustra un posible histograma; tiene una apariencia mucho más regular que el 
histograma de la figura 4.1a). Si se continúa de esta manera midiendo la profundidad más y 
más finamente, la secuencia resultante de histogramas se aproxima a una curva más regular, 
tal como la ilustrada en la figura 4.1c). Como en cada histograma el área total de todos los 
rectángulos es igual a 1, el área total bajo la curva regular también es 1. La probabilidad de 
que la profundidad en un punto seleccionado al azar se encuentre entre ay b es simplemen¬ 
te el área bajo la curva regular entre a y b. Es de manera exacta una curva regular del tipo 
ilustrado en la figura 4.1c) la que especifica un distribución de probabilidad continua. 



Figura 4.1 a) Histograma de probabilidad de profundidad medida al metro más cercano; b) histograma 
de probabilidad de profundidad medida al centímetro más cercano; c) un límite de una secuencia de histo¬ 
gramas discretos. 



DEFINICIÓN 


Sea X una variable aleatoria continua. Entonces, una distribución de probabilidad o 
función de densidad de probabilidad (fdp) de X es una función/(x) tal que para dos 
números cualesquiera ay b con a < b, 

P(a<X<b)= f f(x) dx 
Ja 

Es decir, la probabilidad de que X asuma un valor en el intervalo [a, b] es el área so¬ 
bre este intervalo y bajo la gráfica de la función de densidad, como se ilustra en la fi¬ 
gura 4.2. La gráfica de f(x) a menudo se conoce como curva de densidad. 




Figura 4.2 P[a < X < b) = el área debajo de la curva de densidad entre ay b. 

Para que/(x) sea una función de densidad de probabilidad legítima, debe satisfacer las 
dos siguientes condiciones: 

1. f(x) > 0 con todas las x 

í " 

2. f(x ) dx = área bajo la curva/(x) 

= 1 

Ejemplo 4.4 La dirección de una imperfección con respecto a una línea de referencia sobre un objeto circu¬ 
lar tal como un neumático, un rotor de freno o un volante está, en general, sujeta a incertidum¬ 
bre. Considérese la línea de referencia que conecta el vástago de la válvula de un neumático con 
su punto central y sea X el ángulo medido en el sentido de las manecillas del reloj con respecto 
a la ubicación de una imperfección. Una posible función de densidad de probabilidad de X es 

/(x) =|^60 0<x<360 

lo de lo contrario 
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La función de densidad de probabilidad aparece dibujada en la figura 4.3. Claramente /(jc) 
> 0. El área bajo la curva de densidad es simplemente el área de un rectángulo (altura) 
(base) = G¿f)( 360) = 1. La probabilidad de que el ángulo esté entre 90° y 180° es 


P( 90<X< 180) = 


riso i x 

- fljr = - 

1 so 360 360 


x=180 1 

= — = 0.25 
4 

x=90 


La probabilidad de que el ángulo de ocurrencia esté dentro de 90° de la línea de referencia 
es 


P (0 < X < 90) + P(210 < X < 360) = 0.25 + 0.25 = 0.50 

m m 



Figura 4.3 Función de densidad de probabilidad del ejemplo 4.4. 


Como siempre que 0 < a < < 360 en el ejemplo 4.4, P(a < X < b) depende sólo del an¬ 

cho b — a del intervalo, se dice que X tiene una distribución uniforme. 



DEFINICIÓN 


Se dice que una variable aleatoria continua X tiene una distribución uniforme en el 
intervalo [A, B] si la función de densidad de probabilidad de X es 

í 1 

r, A m J - A < X < B 

f(x;A, B)=\ B - A 

1 0 de lo contrario 



La gráfica de cualquier función de densidad de probabilidad uniforme es como la de la fi¬ 
gura 4.3 excepto que el intervalo de densidad positiva es [A, B] en lugar de [0, 360]. 

En el caso discreto, una función masa de probabilidad indica cómo están distribuidas 
pequeñas “manchas” de masa de probabilidad de varias magnitudes a lo largo del eje de 
medición. En el caso continuo, la densidad de probabilidad está “dispersa” en forma conti¬ 
nua a lo largo del intervalo de posibles valores. Cuando la densidad está dispersa uniforme¬ 
mente a lo largo del intervalo, se obtiene una función de densidad de probabilidad uniforme 
como en la figura 4.3. 

Cuando X es una variable aleatoria discreta, a cada valor posible se le asigna una pro¬ 
babilidad positiva. Esto no es cierto en el caso de una variable aleatoria continua (es decir, 
se satisface la segunda condición de la definición) porque el área bajo una curva de densi¬ 
dad situada sobre cualquier valor único es cero: 

rc+B 

f{x)dx = lím f(x)dx = 0 

E->0 J c - e 

El hecho de que P(X = c) = 0 cuando X es continua tiene una importante consecuen¬ 
cia práctica: La probabilidad de que X quede en algún intervalo entre a y b no depende de 
si el límite inferior a o el límite superior b está incluido en el cálculo de probabilidad 


P(X = c)= f 

J C 


P(a<X<b) = P(a<X<b) = P(a<X<b) = P(a<X< b) 


(4.1) 
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Si X es discreta y tanto a como b son valores posibles (p. ej., X es binomial con n = 20 y 
a = 5, b = 10), entonces cuatro de estas probabilidades son diferentes. 

La condición de probabilidad cero tiene un análogo físico. Considérese una barra 
circular sólida con área de sección transversal = 1 pulg 2 . Coloque la barra a lo largo de un 
eje de medición y supóngase que la densidad de la barra en cualquier punto x está dada por 
el valor/(x) de una función de densidad. Entonces si la barra se rebana en los puntos a y b 
y este segmento se retira, la cantidad de masa eliminada es J* f(x) dx\ si la barra se rebana 
exactamente en el punto c, no se elimina masa. Se asigna masa a segmentos de intervalo de 
la barra pero no a puntos individuales. 

Ejemplo 4.5 “Intervalo de tiempo” en el flujo de tránsito es el tiempo transcurrido entre el tiempo en que 
un carro termina de pasar por un punto fijo y el instante en que el siguiente carro comienza 
a pasar por ese punto. Sea X = el intervalo de tiempo de dos carros consecutivos seleccio¬ 
nados al azar en una autopista durante un periodo de tráfico intenso. La siguiente función 
de densidad de probabilidad de X es en esencia el sugerido en “The Statistical Properties of 
Freeway Traffic” ( Transp. Res. vol. 11: 221-228): 

y (x) = r0.15e -OI5( * _a5) * > 0.5 

0 de lo contrario 

La gráfica de f(x) se da en la figura 4.4; no hay ninguna densidad asociada con inter¬ 
valos de tiempo de menos de 0.5 y la densidad del intervalo decrece con rapidez (exponen¬ 
cial) a medida que x se incrementa a partir de 0.5. Claramente,/(x) > 0; para demostrar que 
fZof(x) dx = 1, se utiliza el resultado obtenido con cálculo integral [”' é~ kx dx = ( \/k)e k ' a . 
Entonces 

f oo Too feo 

f{x) dx = 0.15e~ 015(j: ~ a5) dx = 0.15e 0 075 e ~ 0A5x dx 

J v ' J 0.5 J0.5 

= o 15e 0075 • —L_ e -(0.i5)(0.5) = [ 

0.15 



Figura 4.4 Curva de densidad del intervalo de tiempo entre vehículos en el ejemplo 4.5. 


La probabilidad de que el intervalo de tiempo sea cuando mucho de 5 segundos es 


P(A<5) = f f(x) dx = í 0.15e _015(j:_a5) dx 

J —oo J 0.5 

e 0.075 r 5 

J 0.: 


= 0.15e ü 


5 1 x=5 

£-0.15jc dx = 0 15e 0 075 • 1 j-0.1 5 jc 


5 0.15 

= e 0.075(_ e -0.75 + g-0.075) = i. 078(-0.472 + 0.928) = 0.491 
= Límenos de 5 seg) = P(X < 5) 


A diferencia las distribuciones discretas tales como la binomial, la hipergeométrica y 
la binomial negativa, la distribución de cualquier variable aleatoria continua dada en gene¬ 
ral no puede ser derivada mediante simples argumentos probabilísticos. En cambio, se debe 
hacer una selección juiciosa de la función de densidad de probabilidad basada en conoci¬ 
mientos previos y en los datos disponibles. Afortunadamente, existen algunas familias ge¬ 
nerales de funciones de densidad de probabilidad que se ajustan bien a una amplia variedad 
de situaciones experimentales; varias de éstas se discuten más adelante en el capítulo. 
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4.1 Funciones de densidad de probabilidad 135 

Exactamente como en el caso discreto, a menudo es útil pensar en la población de interés 
como compuesta de valores X en lugar de individuos u objetos. La función de densidad de pro¬ 
babilidad es entonces un modelo de la distribución de valores en esta población numérica y con 
base en este modelo se pueden calcular varias características de la población (tal como la media). 


EJERCICIOS Sección 4.1 (1-10) 


1. Sea X la cantidad de tiempo durante la cual un libro puesto 
en reserva durante dos horas en la biblioteca de una univer¬ 
sidad es solicitado en préstamo por un estudiante seleccio¬ 
nado y suponga que X tiene la función de densidad 

m=\°- 5x °-*- 2 

[0 de lo contrario 


Calcule las siguientes probabilidades: 

a. P(X< 1) 

b. P( 0.5 1.5) 

c. P( 1.5 <X) 

2. Suponga que la temperatura de reacción X (en °C) en cier¬ 
to proceso químico tiene una distribución uniforme con 
A = — 5 y B = 5. 

a. Calcule P(X < 0). 

b. Calcule P(- 2.5 < X < 2.5). 

c. Calcule P(- 2 < X < 3). 

d. Para que k satisfaga — 5<k<k + 4<5, calcule 
P(k < X < k + 4). 

3. El error implicado al hacer una medición es una variable 
aleatoria continua X con función de densidad de probabilidad 

j\ Y) = {0-09375(4 - x 2 ) -2 < x < 2 
0 t de lo contrario 


a. Bosqueje la gráfica def(x). 

b. Calcule P(X > 0). 

c. Calcule P (-1 < X < 1). 

d. Calcule P(X < -0.5 o X > 0.5). 

4. Sea X el esfuerzo vibratorio (lb/pulg 2 ) en el aspa de una tur¬ 
bina de viento a una velocidad del viento particular en un 
túnel aerodinámico. El artículo “Blade Fatigue Life Assess- 
ment with Application to VAWTS” ( J. Solar Energy Engr. 
1982: 107-111) propone la distribución Rayleigh, con fun¬ 
ción de densidad de probabilidad 


0 de lo contrario 


/(.*; e) =■ 


como modelo de la distribución X. 

a. Verifique qu ej{x; 9 ) es una función de densidad de pro¬ 
babilidad legítima. 

b. Suponga que 9 = 100 (un valor sugerido por una gráfica 
en el artículo). ¿Cuál es la probabilidad de que X es cuan¬ 
do mucho de 200? ¿Menos de 200? ¿Por lo menos de 200? 

c. ¿Cuál es la probabilidad de que X esté entre 100 y 200 
(de nuevo con 9 = 100)? 

d. Dé una expresión para P(X £ x). 

5. Un profesor universitario nunca termina su disertación an¬ 
tes del final de la hora y siempre termina dentro de 2 minu¬ 
tos después de la hora. Sea X = el tiempo que transcurre 


entre el final de la hora y el final de la disertación y supon¬ 
ga que la función de densidad de probabilidad de X es 

_ í kx 2 0 £ x £ 2 

[0 de lo contrario 


a. Determine el valor de k y trace la curva de densidad co¬ 
rrespondiente. [ Sugerencia: El área total bajo la gráfica 
de/(x) es 1.] 

b. ¿Cuál es la probabilidad de que la disertación termine 
dentro de un minuto del final de la hora? 

c. ¿Cuál es la probabilidad de que la disertación continúe 
después de la hora durante entre 60 y 90 segundos. 

d. ¿Cuál es la probabilidad de que la disertación continúe 
durante por lo menos 90 segundos después del final de 
la hora? 


6. El peso de lectura real de una pastilla de estéreo ajustado a 
3 gramos en un tocadiscos particular puede ser considerado 
como una variable aleatoria continua X con función de den¬ 
sidad de probabilidad 


m 


ÍMl - (x - 3) 2 ] 

lo 


2 < 4 

de lo contrario 


a. Trace la gráfica de f(x). 

b. Determine el valor de k. 

c. ¿Cuál es la probabilidad de que el peso real de lectura 
sea mayor que el peso prescrito? 

d. ¿Cuál es la probabilidad de que el peso real de lectura 
esté dentro de 0.25 gramos del peso prescrito? 

e. ¿Cuál es la probabilidad de que el peso real difiera del 
peso prescrito por más de 0.5 gramos? 

7. Se cree que el tiempo X (min) para que un ayudante de la¬ 
boratorio prepare el equipo para cierto experimento tiene 
una distribución uniforme con A = 25 y B = 35. 

a. Determine la función de densidad de probabilidad de X 
y trace la curva de densidad de correspondiente. 

b. ¿Cuál es la probabilidad de que el tiempo de preparación 
exceda de 33 min? 

c. ¿Cuál es la probabilidad de que el tiempo de preparación 
esté dentro de dos min del tiempo medio? [Sugerencia: 
Identifique /jl en la gráfica de/fx).] 

d. Con cualquier a de modo que 25<a<a + 2< 35, 
¿cuál es la probabilidad de que el tiempo de preparación 
esté entre a y a + 2 min? 

8. Para ir al trabajo, primero tengo que tomar un camión cerca 
de mi casa y luego tomar un segundo camión. Si el tiempo de 
espera (en minutos) en cada parada tiene una distribución 
uniforme con A = 0 y B = 5, entonces se puede demostrar 
que el tiempo de espera total Y tiene la función de densidad 
de probabilidad 
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f(y ) 




o 


O < y < 5 

5 <y < 10 
y < O o y > 10 


a. Trace la gráfica de la función de densidad de probabili¬ 
dad de Y. 

b. Verifique que f(y) dy = 1. 

J —oo 

c. ¿Cuál es la probabilidad de que el tiempo de espera to¬ 
tal sea cuando mucho de tres minutos? 

d. ¿Cuál es la probabilidad de que el tiempo de espera 
total sea cuando mucho de ocho minutos? 

e. ¿Cuál es la probabilidad de que el tiempo de espera to¬ 
tal esté entre tres y ocho minutos? 

f. ¿Cuál es la probabilidad de que el tiempo de espera to¬ 
tal sea de menos de 2 minutos o de más de 6 minutos? 


Considere de nuevo la función de densidad de probabilidad 
de X = intervalo de tiempo dado en el ejemplo 4.5. ¿Cuál 
es la probabilidad de que el intervalo de tiempo sea 


a. Cuando mucho de seis segundos? 

b. De más de seis segundos? ¿Por lo menos de seis segundos? 

c. De entre cinco y seis segundos? 

10. Una familia de funciones de densidad de probabilidad que 
ha sido utilizada para aproximar la distribución del ingreso, 
el tamaño de la población de una ciudad y el tamaño de fir¬ 
mas es la familia Paleto. La familia tiene dos parámetros, 
k y 8, ambos > 0 y la función de densidad de probabilidad es 


J*i^ x>e 
/(j;M)= 1 

l o x<e 

a. Trace la gráfica de f{x\ k, d). 

b. Verifique que el área total bajo la gráfica es igual a 1. 

c. Si la variable aleatoria X tiene una función de densidad 
de probabilidad/(.tr; k, d), con cualquier b > 6, obtenga 
una expresión para P(X ^ b). 

d. Con 8 < a < b, obtenga una expresión para la probabi¬ 
lidad P(a<X< b). 


4.2 Funciones de distribución acumulativa 
y valores esperados 

Varios de los más importantes conceptos introducidos en el estudio de distribuciones discre¬ 
tas también desempeñan un importante papel en las distribuciones continuas. Definiciones 
análogas a las del capítulo 3 implican reemplazar la suma por integración. 


Función de distribución acumulativa 


DEFINICIÓN 


La función de distribución acumulativa F(x) de una variable aleatoria discreta X da, con cualquier 
número especificado x, la probabilidad P(X < x). Se obtiene sumando la función masa de pro¬ 
babilidad p(y) a lo largo de todos los valores posibles y que satisfacen y < x. La función de dis¬ 
tribución acumulativa de una variable aleatoria continua da las mismas probabilidades P(X < x) 
y se obtiene integrando la función de densidad de probabilidad fiy) entre los límites — °° y x. 


La función de distribución acumulativa F(x) de una variable aleatoria continua X se 
define para todo número x como 

F(x) = P(X <t)=í fiy) dy 

d —oo 

Con cada x, F(x) es el área bajo la curva de densidad a la izquierda de x. Esto se ilustra en 
la figura 4.5, donde F(x) se incrementa con regularidad a medida que x se incrementa. 




Figura 4.5 Una función de densidad de probabilidad y función de distribución acumulativa asociada. 
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e 


PROPOSICIÓN 
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Sea X el espesor de una cierta lámina de metal con distribución uniforme en [A, B\. La fun¬ 
ción de densidad se muestra en la figura 4.6. Con x < A, F(x) = 0, como no hay área bajo 
la gráfica de la función de densidad a la izquierda de la x. Con x > B, F(x) = 1, puesto que 
toda el área está acumulada a la izquierda de la x. Finalmente con A < x < B, 

F(x) = f f(y) dy = [' L dy = - • y 

J -» J a B — A B — A 


y=A 


x — A 
B - A 


ftx) 


i 

B-A 


1 

B-A 


Área sombreada = F(x) 


A B x A x B 

Figura 4.6 Función de densidad de probabilidad de una distribución uniforme. 


La función de distribución acumulativa completa es 


F(x) = 


= 


0 

x — A 


B-A 

1 


x < A 

A<x<B 

x>B 


La gráfica de esta función de distribución acumulativa aparece en la figura 4.7. 



Figura 4.7 Función de distribución acumulativa de una distribución uniforme. 



Utilización de F{x) para calcular probabilidades 

La importancia de la función de distribución acumulativa en este caso, lo mismo que para va¬ 
riables aleatorias discretas, es que las probabilidades de varios intervalos pueden ser calculadas 
con una fórmula o una tabla de F(x). 


Sea X una variable aleatoria continua con función de densidad de probabilidad f(x) y 
función de distribución acumulativa F(x). Entonces con cualquier número a, 

P(X > a) = 1 - F(á) 

y para dos números cualesquiera ay b con a < b. 

P(a<X<b) = F(b) - F(a) 
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La figura 4.8 ilustra la segunda parte de esta proposición; la probabilidad deseada es el área 
sombreada bajo la curva de densidad entre a y b y es igual a la diferencia entre las dos 
áreas sombreadas acumulativas. Esto es diferente de lo que es apropiado para una variable 
aleatoria discreta de valor entero (p. ej., binomial o Poisson): P(a <X<b) = F(b) — F(a — 1) 
cuando ay b son enteros. 


m 


a b b a 

Figura 4.8 Cálculo de P(a < X < b) a partir de probabilidades acumulativas. 




Ejemplo 4.7 


Suponga que la función de densidad de probabilidad de la magnitud X de una carga dinámi¬ 
ca sobre un puente (en newtons) está dada por 


m 


-+-x 0¿i<2 

8 8 

0 de lo contrario 


Para cualquier número x entre 0 y 2, 


Por lo tanto 


0 x < 0 

F(x) = j — 4- — x 2 0¿r<2 

8 16 

^ 1 2 < x 


Las gráficas de/(x) y F(x) se muestran en la figura 4.9. La probabilidad de que la carga esté 
entre 1 y 1.5 es 


P(1 1.5) 


F(1.5)-F(l) 


T (L5) + -77 (L5) 2 

_ 

|(D + “(1) 2 

8 16 


8 16 


19 

— = 0.297 
64 


La probabilidad de que la carga sea de más de uno es 




Figura 4.9 Función de densidad de probabilidad y función de distribución acumulativa del ejemplo 4.7. ■ 
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Una vez que se obtiene la función de distribución acumulativa, cualquier probabilidad 
que implique X es fácil de calcular sin cualquier integración adicional. 

Obtención de f{x) a partir de F(x) 

Para X discreta, la función masa de probabilidad se obtiene a partir de la función de distri¬ 
bución acumulativa considerando la diferencia entre dos valores F(x ). El análogo continuo 
de una diferencia es una derivada. El siguiente resultado es una consecuencia del teorema 
fundamental del cálculo. 



PROPOSICIÓN 


Si X es una variable aleatoria continua con función de densidad de probabilidad fipc) 
y función de distribución acumulativa F(x), entonces con cada x hace posible que la 
derivada F'(x) exista, F'(x) = fíx). 


Ejemplo 4.8 

(continuación 
del ejemplo 
4.6) 


Cuando X tiene una distribución uniforme, F(x) es derivable excepto con x = A y x = B, don¬ 
de la gráfica de F(x ) tiene esquinas afiladas. Como F(x) = 0 con x < A y F(x) = 1 con x > 
B. F'{x) = 0 = f(x) con dicha x. Con A < x < B, 


F\x) 


d Í x-A \ 
dx\B — A ) 


B -A 


=m 


Percentiles de una distribución continua 

Cuando se dice que la calificación de un individuo en una prueba fue el 85° percentil de la 
población, significa que 85% de todas las calificaciones de la población estuvieron por de¬ 
bajo de dicha calificación y que 15% estuvo arriba. Asimismo, el 40° percentil es la califi¬ 
cación que sobrepasa 40% de todas las calificaciones y que es superada por 60% de todas 
las calificaciones. 


DEFINICIÓN 

Sea p un número entere 0 y 1. El (100p)° percentil de la distribución de una variable 


aleatoria continua X, denotada por r¡(p), se define como 



f v(p) 

P = F{r\(p)) = f(y) dy 

(4.2) 


J —00 




De acuerdo con la expresión (4.2), r¡(p) es ese valor sobre el eje de medición de tal suerte 
que el 100 : p% del área bajo la gráfica d sflx) queda a la izquierda de r¡(p) y 100(1 — /?)% que¬ 
da a la derecha. Por lo tanto, r¡(0. 75), el 75° percentil, es tal que el área bajo la gráfica de f(x) 
a la izquierda de tj( 0.75) es 0.75. La figura 4.10 ilustra la definición. 



Figura 4.10 El (100p)° percentil de una distribución continua. 
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Ejemplo 4.9 


DEFINICIÓN 


La distribución de la cantidad de grava (en toneladas) vendida por una compañía de mate¬ 
riales para la construcción particular en una semana dada es una variable aleatoria continua 
X con función de densidad de probabilidad 

- (1 - x 2 ) 0 < x < 1 

2 

0 de lo contrario 



La función de distribución acumulativa de las ventas para cualquier x entre 0 y 1 es 


m = fljd ~y 2 )dy = jíy 




y=0 


= — X 


Las gráficas tanto def(x) como de F(x) aparecen en la figura 4.11. El (100/?)° percentil de 
esta distribución satisface la ecuación 


P = F(rj(p)) 


_3 

2 


V(P) ~ 


(v(p)y 

3 


es decir. 


(i l(p)f ~ 3t/(/?) + 2/7 = 0 

Para el 50° percentil, p = 0.5 y la ecuación que se tiene que resolver es tj 3 — 3r¡ + 1 = 0; 
la solución es 17 = 77 ( 0 . 5 ) = 0.347. Si la distribución no cambia de una semana a otra, en¬ 
tonces a la larga 50% de todas las semanas se realizarán ventas de menos de 0.347 ton y 
50% de más de 0.347 ton. 




Figura 4.11 Función de densidad de probabilidad y función de distribución acumulativa del ejemplo 4.9. ■ 


La mediana de una distribución continua, denotada por ¡H, es el 50° percentil, así que 
fL satisface 0.5 = F(j I). Es decir, la mitad del área bajo la curva de densidad se en¬ 
cuentra a la izquierda de £L y la mitad a la derecha de p . 


Una distribución continua cuya función de densidad de probabilidad es simétrica, lo cual 
significa que la gráfica a la izquierda de un punto en particular es una imagen a espejo de la 
gráfica a la derecha de dicho punto, tiene una mediana /i igual al punto de simetría, puesto 
que la mitad del área bajo la curva queda a uno u otro lado de este punto. La figura 4.12 da 
varios ejemplos. A menudo se supone que el error en la medición de una cantidad física tie¬ 
ne una distribución simétrica. 

f(x) /( x) 


- 1 - 1 - 1 -► X 

A fí B 



Figura 4.12 Medianas y distribuciones simétricas. 
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DEFINICIÓN 


Ejemplo 4.10 

(continuación 
del ejemplo 
4.9) 


PROPOSICIÓN 


Ejemplo 4.11 


Valores esperados 

Para una variable aleatoria discreta X, E(X) se obtuvo sumando x • p(x) a lo largo de posibles 
valores de X. Aquí se reemplaza la suma con la integración y la función masa de probabilidad 
por la función de densidad de probabilidad para obtener un promedio ponderado continuo. 


El valor esperado o valor medio de una variable aleatoria continua X con función de 
densidad de probabilidad f(x) es 


¡jLv = E(X) = i x • f(x) dx 

J —oo 


La función de densidad de probabilidad de las ventas semanales de grava X fue 

í 3 


por lo tanto 


f(x)=\ 2 


(1 — x~) 0 ^ x ^ 1 


0 


de lo contrario 


E(X) = /" x •/(x) dx = f g x • | (1 - x 2 ) 
= ~ Jo (x - X 3 ) dx = 


2 

3 /x 2 


dx 


2 \ 2 


Cuando la función de densidad de probabilidad/(x) especifica un modelo para la dis¬ 
tribución de valores en una población numérica, entonces p, es la media de la población, la 
cual es la medida más frecuentemente utilizada de la ubicación o centro de la población. 

Con frecuencia se desea calcular el valor esperado de alguna función h(X) de la varia¬ 
ble aleatoria X. Si se piensa en h(X) como una nueva variable aleatoria Y, se utilizan técni¬ 
cas de estadística matemática para derivar la función de densidad de probabilidad de Y y 
E( Y) se calcula a partir de la definición. Afortunadamente, como en el caso discreto, existe 
una forma más fácil de calcular E[h(X)]. 


Si X es una variable aleatoria continua con función de densidad de probabilidad /(x) 
y h(X) es cualquier función de X, entonces 


E[h(X)] 


fx h(X ) = Hx) -fix) dx 


Dos especies compiten en una región por el control de una cantidad limitada de un cierto re¬ 
curso. Sea X = la proporción del recurso controlado por la especie 1 y suponga que la fun¬ 
ción de densidad de probabilidad de X es 

0 — * - i 

' lO de lo contrario 

la cual es una distribución uniforme en [0, 1]. (En su libro Ecological Diversity, E. C. Pielou 
llama a esto el modelo del “palo roto” para la asignación de recursos, puesto que es análogo 
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a la ruptura de un palo en un lugar seleccionado al azar.) Entonces la especie que controla 
la mayor parte de este recurso controla la cantidad 

f 1 - X si 0 < X < - 

h(X) = máx(X, 1 - X) = < 2 

I X si — < X < 1 
2 

La cantidad esperada controlada por la especie que controla la mayor parte es entonces 
E[h(X)] = í máx(.r, 1 — x) • f(x) dx = í máx(x, 1 — x) • 1 dx 

J -00 J O 

rv 2 f 1 3 

= (1 — x) • \ dx + \ x • 1 dx = — ■ 

J O V ’ J 1/2 4 

Para h(X) una función lineal, E[h(X)] = E(aX + b) = aE{X) + b. 

En el caso discreto, la varianza de X se definió como la desviación al cuadrado esperada con 
respecto a ¡jl y se calculó por medio de suma. En este caso de nuevo la integración reempla¬ 
za a la suma. 


DEFINICIÓN 


La varianza de una variable aleatoria continua X con función de densidad de proba¬ 
bilidad f(x) y valor medio ¡jl es 

0-1 = V(X) = r (x - fx) 2 ■f(x) dx = E[(X - /a) 2 ] 

J —00 

La desviación estándar (DE) de X es cr x = V V(X). 


La varianza y la desviación estándar dan medidas cuantitativas de cuánta dispersión hay 
en la distribución o población de valores x. La forma más fácil de calcular cr 2 es utilizar una 
fórmula abreviada. 


PROPOSICIÓN 


Ejemplo 4.12 

(continuación 
del ejemplo 
4.10) 


1 / 3 \2 19 

ViX) = - - - = = 0.059 y <r x = 0.244 ■ 

5 \%) 320 J x 

Cuando h{X) = aX + b, el valor esperado y la varianza de h(X) satisfacen las mismas pro¬ 
piedades que en el caso discreto: E[h{X)] = a/i + b y V[h(X )] = a 2 ’cr 2 . 


V(X) = E(X 2 ) - ¡E(X)] 2 

Para X = ventas semanales de grava, se calcula E(X) = f. Como 

E(X 2 ) = J x 2 ■ f(x) dx = J o x 2 • (1 — x 2 ) dx 

T 1 3 1 

= l o f(* 2 -* 4 )¿r = - 


EJERCICIOS Sección 4.2 (11-27) 


11 . La función de distribución acumulativa del tiempo de prés¬ 
tamo X como se describe en el ejercicio 1 es 


F(x) = 


í x < 0 

<— 0<x<2 

4 


Use ésta para calcular lo siguiente: 

a. P(X < 1) 

b. P(0.5 <X< 1) 

c. P(X > 0.5) 

d. El tiempo de préstamo medio /X [resolver 0.5 = F( /X)] 

e. F(x) para obtener la función de densidad j\x) 


2 <x 
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f. E(X) 

& V(X)ycr x 

h. Si al prestatario se le cobra una cantidad h(X) = X 2 cuan¬ 
do el tiempo de préstamo es X, calcule el cobro esperado 
E\h(X)}. 


12 . 


La función de distribución acumulativa de X (= error de 
medición) del ejercicio 3 es 


0 


F(x) = 




{ 1 


x < —2 


-2 < x < 2 
2 £ x 


a. Calcule P(X < 0). 

b. Calcule P(-l <X< 1). 

c. Calcule P(0.5 < X). 

d. Verifique que/(x) está dada en el ejercicio 3 obteniendo 
F\x). 

e. Verifique que /X = 0. 


13. El ejemplo 4.5 introdujo el concepto de intervalo de tiempo 
en el flujo de tránsito y propuso una distribución particular 
para X = el intervalo de tiempo entre dos carros consecuti¬ 
vos seleccionados al azar (s). Suponga que en un entorno de 
tránsito diferente, la distribución del intervalo de tiempo 
tiene la forma 


m 



X > 1 
X< 1 


a. Determine el valor de k con el cual/fx) es una función de 
densidad de probabilidad legítima. 

b. Obtenga la función de distribución acumulativa. 

c. Use la función de distribución acumulativa de (b) para 
determinar la probabilidad de que el intervalo de tiempo 
exceda de 2 segundos y también la probabilidad de que 
el intervalo esté entre 2 y 3 segundos. 

d. Obtenga un valor medio del intervalo de tiempo y su 
desviación estándar. 

e. ¿Cuál es la probabilidad de que el intervalo de tiempo 
quede dentro de una desviación estándar del valor medio? 

14. El artículo “Modeling Sediment and Water Column Interac- 

tions for Hidrophobic Pollutants” ( Water Research, 1984: 

1169-1174) sugiere la distribución uniforme en el intervalo 

7.5, 20) como modelo de profundidad (cm) de la capa de 

bioturbación en sedimento en una región. 

a. ¿Cuáles son la media y la varianza de la profundidad? 

b. ¿Cuál es la función de distribución acumulativa de la 
profundidad? 

c. ¿Cuál es la probabilidad de que la profundidad observa¬ 
da sea cuando mucho de 10? ¿Entre 10 y 15? 

d. ¿Cuál es la probabilidad de que la profundidad observa¬ 
da esté dentro de una desviación estándar del valor me¬ 
dio? ¿Dentro de dos desviaciones estándar? 


15 . 


Sea X la cantidad de espacio ocupado por un artículo colo¬ 
cado en un contenedor de un pie 3 . La función de densidad 
de probabilidad de X es 



90x 8 (l — x) 0 < x < 1 
0 de lo contrario 


a. Dibuje la función de densidad de probabilidad. Luego 
obtenga la función de distribución acumulativa de X y 
dibújela. 
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b. ¿Cuál es P(X < 0.5) [es decir, F(0.5)]? 

c. Con la función de distribución acumulativa de (a), ¿cuál 
es P( 0.25 < X < 0.5)? ¿Cuál es P(0.25 < V < 0.5)? 

d. ¿Cuál es el 75° percentil de la distribución? 

e. Calcule E(X) y <r x . 

f. ¿Cuál es la probabilidad de que X esté a más de una des¬ 
viación estándar de su valor medio? 


16. Responda los incisos a)-f) del ejercicio 15 con X = tiempo 
de disertación después de la hora dado en el ejercicio 5. 

17. Si la distribución de X en el intervalo [A, 5] es uniforme. 

a. Obtenga una expresión para el (100p)° percentil. 

b. Calcule E(X), V(X) y a x . 

c. Con n, un entero positivo, calcule E(X n ). 

18. Sea X el voltaje a la salida de un micrófono y suponga que 
X tiene una distribución uniforme en el intervalo de — 1 a 1. 
El voltaje es procesado por un “limitador duro” con valores 
de corte de —0.5 y 0.5, de modo que la salida del limitador 
es una variable aleatoria Y relacionada con X por Y = X si 
IXl < 0.5, Y = 0.5 si X > 5 y Y = -0.5 si X < -0.5. 

a. ¿Cuál es P(Y = 0.5)? 

b. Obtenga la función de distribución acumulativa de y y 
dibújela. 


19. Sea X una variable aleatoria continua con función de distri¬ 
bución acumulativa 


0 x< 0 


F(x) = 


— 

4 



0 <x < 4 
x > 4 


[Este tipo de función de distribución acumulativa es sugeri¬ 
do en el artículo “Variabilitiy in Measured Bedload-Trans- 
port Rates” ( Water Resources Bull., 1985: 39-48) como 
modelo de cierta variable hidrológica.] Determinar: 

a. P(X < 1) 

b. F(1 < X < 3) 

c. La función de densidad de probabilidad de X 


20. Considere la función de densidad de probabilidad del tiem¬ 
po de espera total Y de dos camiones 


/oo = 


¿y o ~ y < 5 
f-¿y s^io 


o 


de lo contrario 


introducida en el ejercicio 8. 

a. Calcule y trace la función de distribución acumulativa 
de y. [Sugerencia'. Considere por separado 0 — y < 5 y 
5 £ y £ 10 al calcular F(y). Una gráfica de la función 
de densidad de probabilidad debe ser útil.] 

b. Obtenga una expresión para el (100¿>)° percentil. [Sugeren¬ 
cia: Considere por separado 0 < p < 0.5 y 0.5 < p < L] 

c. Calcule E(Y) y V{Y). ¿Cómo se comparan estos valores 
con el tiempo de espera probable y la varianza de un 
solo camión cuando el tiempo está uniformemente dis¬ 
tribuido en [0, 5]? 


21. Un ecólogo desea marcar una región de muestreo circular 
de 10 m de radio. Sin embargo, el radio de la región resul¬ 
tante en realidad es una variable aleatoria R con función de 
densidad de probabilidad 


























c4_pl30-183.qxd 3/12/08 4:04 AM Page 144 



144 


CAPÍTULO 4 Variables aleatorias continuas y distribuciones de probabilidad 


,,, -[l-(lO-r) 2 ] 9<r<ll 

ftr) = \ 4 

[O de lo contrario 

¿Cuál es el área esperada de la región circular resultante? 


22. La demanda semanal de gas propano (en miles de galones) 
de una instalación particular es una variable aleatoria X con 
función de densidad de probabilidad 

2 (i-l) 1 ~ ~ 2 

0 de lo contrario 

a. Calcule la función de distribución acumulativa de X. 

b. Obtenga una expresión para el (100p)° percentil. ¿Cuál 
es el valor de /X? 

c. Calcule E(X) y V(X). 

d. Si 1500 galones están en existencia al principio de la se¬ 
mana y no se espera ningún nuevo suministro durante 
la semana, ¿cuántos de los 1500 galones se espera que 
queden al final de la semana? [Sugerencia'. Sea h(x) = 
cantidad que queda cuando la demanda es x.] 

23. Si la temperatura a la cual cierto compuesto se funde es una 
variable aleatoria con valor medio de 120°C y desviación es¬ 
tándar de 2°C, ¿cuáles son la temperatura media y la desvia¬ 
ción estándar medidas en °F? [ Sugerencia: °F = 1.8°C + 32.] 

24. La función de densidad de probabilidad de Pareto de X es 

ÍAill x>0 

fix-k, 6) =< x k+1 

10 x < 8 

introducida en el ejercicio 10. 

a. Si k > 1, calcule E(X). 

b. ¿Qué se puede decir sobre E{X) si k = 1? 

c. Si k > 2, demuestre que V(X) = kd 2 (k — 1 )~ 2 (k — 2) _1 . 

d. Si Ar = 2, ¿qué se puede decir sobre V(X)1 

e. ¿Qué condiciones en cuanto a k son necesarias para ga¬ 
rantizar que E{X") es finito? 

25. Sea X la temperatura en °C a la cual ocurre una reacción quí¬ 
mica y sea Fia temperatura en °F (así que Y = 1.8X + 32). 


a. Si la mediana de la distribución X es /X, demuestre que 
1.8 /X + 32 es la mediana de la distribución Y. 

b. ¿Cómo está relacionado el 90° percentil de la distribu¬ 
ción Y con el 90 a de la distribución XI Verifique su con¬ 
jetura. 

c. Más generalmente, si Y = aX + b, ¿cómo está relacio¬ 
nado cualquier percentil de la distribución Y con el per¬ 
centil correspondiente de la distribución X? 

26 . Sea X los gastos médicos totales (en miles de dólares) in¬ 
curridos por un individuo particular durante un año dado. 
Aunque X es una variable aleatoria discreta, suponga que 
su distribución es bastante bien aproximada por una distri¬ 
bución continua con función de densidad de probabilidad 
f(x) = k( 1 + x/2.5)~ 7 con i>0. 

a. ¿Cuál es el valor de kl 

b. Dibuje la función de densidad de probabilidad de X. 

c. ¿Cuáles son el valor esperado y la desviación estándar 
de los gastos médicos totales? 

d. Un individuo está cubierto por un plan de aseguramiento 
que le impone una provisión deducible de $500 (así que 
los primeros $500 de gastos son pagados por el individuo). 
Luego el plan pagará 80% de cualquier gasto adicional que 
exceda de $500 y el pago máximo por parte del individuo 
(incluida la cantidad deducible) es de $2500. Sea Fia can¬ 
tidad de gastos médicos de este individuo pagados por la 
compañía de seguros. ¿Cuál es el valor esperado de F? 

[, Sugerencia : Primero indague qué valor de X correspon¬ 
de al gasto máximo que sale del bolsillo de $2500. Lue¬ 
go escriba una expresión para F como una función de X 
(la cual implique varios precios diferentes) y calcule el 
valor esperado de la función.] 

27. Cuando se lanza un dardo a un blanco circular, considere la 
ubicación del punto de aterrizaje respecto al centro. Sea X 
el ángulo en grados medido con respecto a la horizontal 
y suponga que X está uniformemente distribuida en [0, 360], 
Defina F como la variable transformada F = h{X) = 
(2tt/360)X — 77 , por lo tanto, F es el ángulo medido en ra¬ 
dianes y F está entre —ir y 77. Obtenga E(Y) y a y obteniendo 
primero E{X) y a x y luego utilizando el hecho de que h{X) 
es una función lineal de X. 




4.3 Distribución normal 


La distribución normal es la más importante en toda la probabilidad y estadística. Muchas po¬ 
blaciones numéricas tienen distribuciones que pueden ser representadas muy fielmente por 
una curva normal apropiada. Los ejemplos incluyen estaturas, pesos y otras características fí¬ 
sicas (el famoso artículo Biométrica 1903 “On the Laws of Inheritance in Man” discutió mu¬ 
chos ejemplos de esta clase), errores de medición en experimentos científicos, mediciones 
antropométricas en fósiles, tiempos de reacción en experimentos psicológicos, mediciones de 
inteligencia y aptitud, calificaciones en varios exámenes y numerosas medidas e indicadores 
económicos. Incluso cuando la distribución subyacente es discreta, la curva normal a menu¬ 
do da una excelente aproximación. Además, aun cuando las variables individuales no estén 
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normalmente distribuidas, las sumas y promedios de las variables en condiciones adecuadas 
tendrán de manera aproximada una distribución normal; este es el contenido del Teorema del 
Límite Central discutido en el siguiente capítulo. 


Se dice que una variable aleatoria continua X tiene una distribución normal con pa¬ 
rámetros ¡i y cr (o /i y cr 2 ), donde — °°</A<°°ycr>o, si la función de densidad de 
probabilidad de X es 

/(*; /a, cr) = J_ e -ó-M) 2 /(2a 2 ) -oo < x < oo (4.3) 

w 2 tt cr 


De nuevo e denota la base del sistema de logaritmos naturales y es aproximadamente igual 
a 2.71828 y ir representa la conocida constante matemática con un valor aproximado de 
3.14159. El enunciado de que X está normalmente distribuida con los parámetros /a y cr 2 a 
menudo se abrevia como X ~ N{¡±, cr 2 ). 

Claramente f(x\ /a, cr) > 0 aunque se tiene que utilizar un argumento de cálculo un 
tanto complicado para verificar que [ f(x; /i, cr) dx = 1. Se puede demostrar que E(X) = /a 
y V(X) = cr 2 , de modo que los parámetros son la media y la desviación estándar de X. La fi¬ 
gura 4.13 representa gráficas de /(jc; /a, cr) de varios pares diferentes (/a, cr). Cada curva de 
densidad es simétrica con respecto a ¡x y acampanada, de modo que el centro de la campa¬ 
na (punto de simetría) es tanto la media de la distribución como la mediana. El valor de cr 
es la distancia desde /a hasta los puntos de inflexión de la curva (los puntos donde la curva 
cambia de virar hacia abajo a virar hacia arriba). Los grandes valores de cr producen gráfi¬ 
cas que están bastante extendidas en torno a /a, en tanto que los valores pequeños de cr dan 
gráficas con una alta cresta sobre /a y la mayor parte del área bajo de la gráfica bastante cer¬ 
ca de /a. Así pues, una cr grande implica que se puede observar muy bien un valor de X ale¬ 
jado de /a, en tanto que dicho valor es bastante improbable cuando cr es pequeña. 




Figura 4.13 Curvas de densidad normal. 


Distribución normal estándar 

Para calcular P{a < X < b) cuando X es una variable aleatoria normal con parámetros ¡xy cr, 
se debe determinar 


f — e -(*-íb7(2<7 2 ) dx (4.4) 

U Virrey 

Ninguna de las técnicas estándar de integración puede ser utilizada para evaluar la expre¬ 
sión (4.4). En cambio, con /a = 0 y cr = l,se calculó la expresión (4.4) por medio de téc¬ 
nicas numéricas y se tabuló para ciertos valores de a y b. Esta tabla también puede ser 
utilizada para calcular probabilidades con cualesquiera otros valores de /a y cr considerados. 
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DEFINICIÓN 


Ejemplo 4.13 


La distribución normal con valores de parámetro ¡i = 0 y <r = lse llama distribu¬ 
ción normal estándar. Una variable aleatoria que tiene una distribución normal es¬ 
tándar se llama variable aleatoria normal estándar y se denotará por Z. La función 
de densidad de probabilidad de Z es 

1 

/(z; 0, 1) = - r— - e z ' 2 -oo < z < oo 

V/7 T 

La gráfica de/íz; 0, 1) se llama curva normal estándar (o z). La función de distribu¬ 
ción acumulativa de Z es P(Z <;) = 0, 1) dy, la cual será denotada por <b(z). 


La distribución normal estándar no sirve con frecuencia como modelo de una pobla¬ 
ción que surge naturalmente. En cambio, es una distribución de referencia de la que se 
puede obtener información sobre otra distribución normal. La tabla A.3 del apéndice, da 
<f>(z) = P{Z < z), el área bajo la curva de densidad normal estándar a la izquierda de z con 
Z = —3.49, —3.48, . . ., 3.48, 3.49. La figura 4.14 ilustra el tipo de área acumulativa (pro¬ 
babilidad) tabulada en la tabla A.3. Con esta tabla, varias probabilidades que implican Z 
pueden ser calculadas. 


Área sombreada = <J>(z) 



Figura 4.14 Áreas acumulativas normales estándar tabuladas en la tabla A.3 del apéndice. 

Determínense las siguientes probabilidades normales estándar: (a) P(Z < 1.25), (b) P(Z > 
1.25), (c)P(Z< —1.25) y (d) P(—0.38 < Z < 1.25). 

a. P(Z < 1.25) = ( I>( 1 .25), una probabilidad tabulada en la tabla A.3 del apéndice en la in¬ 
tersección de la fila 1.2 y la columna 0.05. El número allí es 0.8944, así que P(Z < 1.25) 
= 0.8944. La figura 4.15(a) ilustra esta probabilidad. 




Figura 4.15 Áreas (probabilidades) de curvas normales del ejemplo 4.13. 

b. P(Z > 1.25) = 1 — P(Z < 1.25) = 1 — <I>(L25), el área bajo la curva z a la derecha 
de 1.25 (un área de cola superior). En ese caso 4>(1.25) = 0.8944 implica que P(Z > 
1.25) = 0.1056. Como Z es una variable aleatoria continua, P{Z > 1.25) = 0.1056. 
Véase la figura 4.15(b). 

c. P(Z < —1.25) = <t>(— 1.25), un área de cola inferior. Directamente de la tabla A.3 del 
apéndice 4>(—1.25) = 0.1056. Por simetría de la curva z, ésta es la misma respuesta 
del inciso b). 
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d. P(— 0.38 < Z < 1.25) es el área bajo la curva normal estándar sobre el intervalo cuyo 
punto extremo izquierdo es —0.38 y cuyo punto extremo derecho es 1.25. Según la sec¬ 
ción 4.2, si X es una variable aleatoria continua con función de distribución acumulativa 
F(x), entonces P(a < X < b) = F(b) — F(a). Por lo tanto, P(— 0.38 < Z < 1.25) = 
$(1.25) - $(-0.38) = 0.8944 - 0.3520 = 0.5424. (Véase la figura 4.16.) 



Figura 4.16 P(-0.38 < Z< 1.25) como la diferencia entre dos áreas acumulativas. ■ 


Percentiles de la distribución normal estándar 

Con cualquier p entre 0 y 1, se puede utilizar la tabla A.3 del apéndice para obtener el 
(I OOp)" percentil de la distribución normal estándar. 

El 99° percentil de la distribución normal estándar es el valor sobre el eje horizontal tal que 
el área bajo la curva z a la izquierda de dicho valor es 0.9900. La tabla A.3 del apéndice da 
con z ñja el área bajo la curva normal estándar a la izquierda de z, mientras que aquí se tiene 
el área y se desea el valor de z. Este es problema “inverso” a P(Z < z) = ? así que la tabla 
se utiliza a la inversa: Encuentre en la mitad de la tabla 0.9900; la fila y la columna en la que se 
encuentra identificado el 99° percentil z- En este caso 0.9901 queda en la intersección 
de la fila 2.3 y la columna 0.03, así que el 99° percentil es (aproximadamente) z = 2.33. 
(Véase la figura 4.17). Por simetría, el primer percentil está tan debajo de 0 como el 99° está 
sobre 0, así que es igual a —2.33 (1% queda debajo del primero y también sobre el 99°). 
(Véase la figura 4.18.) 




Figura 4.17 Localización del 99° percentil. 



—2.33 = ler percentil 2.33 = 99° percentil 


Figura 4.18 Relación entre el 1er y 99° percentiles. 
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En general, la fila y la columna de la tabla A.3 del apéndice, donde el ingreso p está 
localizado identifican el (I ()()p)" percentil (p. ej., el 67° percentil se obtiene localizando 
0.6700 en el cuerpo de la tabla, la cual da z — 0.44). Si p no aparece, a menudo se utiliza el 
número más cercano a él, aunque la interpolación lineal da una respuesta más precisa. Por 
ejemplo, para encontrar el 95° percentil, se busca 0.9500 adentro de la tabla. Aunque 0.9500 
no aparece, tanto 0.9495 como 0.9505 sí, correspondientes a z = 1-64 y 1.65, respectiva¬ 
mente. Como 0.9500 está a la mitad entre las dos probabilidades que sí aparecen, se utiliza¬ 
rá 1.645 como el 95° percentil y —1.645 como el 5 o percentil. 

Notación z a 

En inferencia estadística, se necesitan valores sobre el eje horizontal z que capturen ciertas 
áreas de cola pequeña bajo la curva normal estándar. 


Notación 

z a denotará el valor sobre el eje z para el cual a del área bajo la curva z queda a la de¬ 
recha de z a . (Véase la figura 4.19.) 


Por ejemplo, z 0 10 captura el área de cola superior 0.10 y z 001 captura el área de cola superior 
0 . 01 . 



z a 

Figura 4.19 Notación z a ilustrada. 


Como a del área bajo la curva z queda a la derecha de z a , 1 — a del área queda a su 
izquierda. Por lo tanto, z a es el 100(1 — a)° percentil de la distribución normal estándar. 
Por simetría el área bajo la curva normal estándar a la izquierda de — z a también es a. Los 
valores z a en general se conocen como valores críticos z. La tabla 4.1 incluye los percenti- 
les z y los valores z a más útiles. 


Tabla 4.1 Percentiles normales estándar y valores críticos 


Percentil 

90 

95 

97.5 

99 

99.5 

99.9 

99.95 

a (área de cola) 

0.1 

0.05 

0.025 

0.01 

0.005 

0.001 

0.0005 

= 100(1 - a)° 

1.28 

1.645 

1.96 

2.33 

2.58 

3.08 

3.27 


percentil 


Ejemplo 4.15 z 005 es el 100(1 — 0.05)° = 95° percentil de la distribución normal estándar, por lo tanto 

Zq 05 = 1-645. El área bajo la curva normal estándar a la izquierda de —z 005 también es 0.05. 
(Véase la figura 4.20.) 
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-1.645 = -Zo.o 5 ¿ 0.05 = 95°percentil = 1.645 
Figura 4.20 Determinación de z 005 . ■ 


Distribuciones normales no estándar 

Cuando X ~ N(jx, cr 2 ), las probabilidades que implican X se calculan “estandarizando”. La 
variable estandarizada es (X — /jl) a. Al restar ¡± la media cambia de/r a cero y luego al 
dividir entre cr cambian las escalas de la variable de modo que la desviación estándar es uno 
en lugar de cr. 


Si X tiene una distribución normal con media ¡jl y desviación estándar cr, entonces 

z= W 
cr 

tiene una distribución normal estándar. Por lo tanto, 

a ~ P < z < b - /i \ 
cr cr y 

P(X < a) = <&( a ~ P(X > b) = 1 - ®( b ~ 



P(a <X<b) = P\ 



La idea clave de la proposición es que estandarizando cualquier probabilidad que implique 
X puede ser expresada como una probabilidad que implica una variable aleatoria normal es¬ 
tándar Z, de modo que se pueda utilizar la tabla A.3 del apéndice. Esto se ilustra en la figu¬ 
ra 4.21. La proposición se comprueba escribiendo la función de distribución acumulativa de 
Z = (X — /a)/cr como 

rcrz+ix 

P(Z < z) = P(X < az + ju,) = f(x\ fji, cr) dx 

J —00 

Utilizando un resultado del cálculo, esta integral puede ser derivada con respecto a z para 
que dé la función de densidad de probabilidad deseada/(z; 0, 1). 


JV( fí, a 2 ) 


N( 0, 1) 



Figura 4.21 Igualdad de áreas de curvas normales estándar y no estándar. 
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Ejemplo 4.16 El tiempo que requiere un conductor para reaccionar a las luces de freno de un vehículo que 
está desacelerando es crítico para evitar colisiones por alcance. El artículo “Fast-Rise Bra- 
ke Lamp as a Collision-Prevention Device” ( Ergonomics , 1993: 391-395), sugiere que el 
tiempo de reacción de respuesta en tráfico a una señal de freno de luces de freno estándar 
puede ser modelado con una distribución normal que tiene un valor medio de 1.25 s y des¬ 
viación estándar de 0.46 s. ¿Cuál es la probabilidad de que el tiempo de reacción esté entre 
1.00 s y 1.75 s? Si X denota el tiempo de reacción, entonces estandarizando se obtiene 


1.00 1.75 

si y sólo si 


1.00 - 1.25 __ X- 1.25 1.75 - 1.25 

0.46 “ 0.46 “ 0.46 


Por lo tanto 


P(1.00 <X< 1.75) = P| 


1.00 - 1.25 


< Z< 


0.46 

= P(-0.54<Z< 1.09) 


1.75 - 1.25 \ 

0.46 J 

$(1.09) - $(-0.54) 


= 0.8621 - 0.2946 = 0.5675 




Figura 4.22 Curvas normales del ejemplo 4.16. 



Esto se ilustra en la figura 4.22. Asimismo, si se ven los 2 s como un tiempo de reacción crí¬ 
ticamente largo, la probabilidad de que el tiempo de reacción real exceda este valor es 

P(X > 2) = p(z > 2 ~ ^ \ =P(Z> 1.63) = 1 - $(1.63) = 0.0516 ■ 

Estandarizar no lleva nada más que a calcular una distancia al valor medio y luego reexpre¬ 
sarla como algún número de desviaciones estándar. Por lo tanto, si p. = 100 y cr = 15, en¬ 
tonces x = 130 corresponde a z = (130 — 100)/15 = 30/15 = 2.00. Es decir, 130 está a 2 
desviaciones estándar sobre (a la derecha de) el valor medio. Asimismo, estandarizando 85 
se obtiene (85 — 100)/15 = —1.00, por lo tanto, 85 está a una desviación estándar por de¬ 
bajo de la media. La tabla z se aplica a cualquier distribución normal siempre que se pien¬ 
se en función del número de desviaciones estándar de alejamiento del valor medio. 

Ejemplo 4.17 Se sabe que el voltaje de ruptura de un diodo seleccionado al azar de un tipo particular está 
normalmente distribuido. ¿Cuál es la probabilidad de que el voltaje de ruptura de un diodo 
esté dentro de una desviación estándar de su valor medio? Esta pregunta puede ser respondí- 
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da sin conocer p o o\ en tanto se sepa que la distribución es normal; la respuesta es la mis¬ 
ma para cualquier distribución normal: 

P(X está dentro de 1 desviación estándar de su media) = P(p — cr<X<p + cr) 

= ~ o- ~ /i < z < /i + o - ~ P j 

= P(-1.00<Z< 1.00) 

= $(1.00) - $(-1.00) = 0.6826 

La probabilidad de que X esté dentro de dos desviaciones estándar es P(-2.00 < Z < 2.00) = 
0.9544 y dentro de tres desviaciones estándar es P(-3.00 SZ< 3.00) = 0.9974. ■ 

Los resultados del ejemplo 4.17 a menudo se reportan en forma de porcentaje y se les 
conoce como regla empírica (porque la evidencia empírica ha demostrado que los histogra- 
mas de datos reales con frecuencia pueden ser aproximados por curvas normales). 


Si la distribución de la población de una variable es (aproximadamente) normal, 
entonces 

1. Aproximadamente 68% de los valores están dentro de 1 DE de la media. 

2. Aproximadamente 95% de los valores están dentro de 2 DE de la media. 

3. Aproximadamente 99.7% de los valores están dentro de 3 DE de la media. 



En realidad es inusual observar un valor de una población normal que esté mucho más le¬ 
jos de 2 desviaciones estándar de p. Estos resultados serán importantes en el desarrollo de 
procedimientos de prueba de hipótesis en capítulos posteriores. 

Percentiles de una distribución normal arbitraria 

El (lOOp) 0 percentil de una distribución normal con media p y desviación estándar cr es fá¬ 
cil de relacionar con el (100p)° percentil de la distribución normal estándar. 



PROPOSICIÓN 


(100//)" percentil 

(100//)" percentil 


de (p, a ) normal ^ 

de normal estándar 

• cr 





Otra forma de decir es que si z es el percentil deseado de la distribución normal estándar, 
entonces el percentil deseado de la distribución (p, cr) normal está a z desviaciones están¬ 
dar de p. 

Ejemplo 4.18 La cantidad de agua destilada despachada por una cierta máquina está normalmente distri¬ 
buida con valor medio de 64 oz y desviación estándar de 0.78 oz. ¿Qué tamaño de contene¬ 
dor c asegurará que ocurra rebosamiento sólo 0.5% del tiempo? Si X denota la cantidad 
despachada, la condición deseada es que P(X > c) = 0.005, o, en forma equivalente, que 
P(X < c) = 0.995. Por lo tanto, c es el 99.5° percentil de la distribución normal con p = 64 
y cr = 0.78. El 99.5° percentil de la distribución normal estándar es de 2.58, por lo tanto, 

c = 77(0.995) = 64 + (2.58)(0.78) = 64 + 2.0 = 66 oz 


Esto se ilustra en la figura 4.23. 
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Ejemplo 4.19 



c = 99.5° percentil = 66.0 

Figura 4.23 Distribución de la cantidad despachada en el ejemplo 4.18. 


Distribución normal y poblaciones discretas 

La distribución normal a menudo se utiliza como una aproximación a la distribución de va¬ 
lores en una población discreta. En semejantes situaciones, se debe tener un cuidado espe¬ 
cial para asegurarse de que las probabilidades se calculen con precisión. 

Se sabe que el coeficiente intelectual en una población particular (medido con una prueba 
estándar) está más o menos normalmente distribuido con p = 100ycr = 15. ¿Cuál es la 
probabilidad de que un individuo seleccionado al azar tenga un CI de por lo menos 125? 
Con X = el CI de una persona seleccionada al azar, se desea P(X > 125). La tentación en 
este caso es estandarizar X > 125 como en ejemplos previos. Sin embargo, la distribución 
de la población de coeficientes intelectuales en realidad es discreta, puesto que los coefi¬ 
cientes intelectuales son valores enteros. Así que la curva normal es una aproximación a un 
histograma de probabilidad discreto como se ilustra en la figura 4.24. 

Los rectángulos del histograma están centrados en enteros, por lo que los coeficien¬ 
tes intelectuales de por lo menos 125 corresponden a rectángulos que comienzan en 124.5, 
la zona sombreada en la figura 4.24. Por lo tanto, en realidad se desea el área bajo la curva 
aproximadamente normal a la derecha de 124.5. Si se estandariza este valor se obtiene P(Z 
> 1.63) = 0.0516, en tanto que si se estandariza 125 se obtiene P(Z > 1.67 = 0.0475. La 
diferencia no es grande, pero la respuesta 0.0516 es más precisa. Asimismo, P(X = 125) se¬ 
ria aproximada por el área entre 124.5 y 125.5, puesto que el área bajo la curva normal so¬ 
bre el valor único de 125 es cero. 



Figura 4.24 Aproximación normal a una distribución discreta. ■ 

La corrección en cuanto a discrecionalidad de la distribución subyacente en el ejem¬ 
plo 4.19 a menudo se llama corrección por continuidad. Es útil en la siguiente aplicación 
de la distribución normal al cálculo de probabilidades binomiales. 

Aproximación de la distribución binomial 

Recuérdese que el valor medio y la desviación estándar de una variable aleatoria binomial 
X son p x = np y cr x = V npq, respectivamente. La figura 4.25 muestra una histograma de 
probabilidad binomial d e la distrib ución binomial con n = 20, p = 0.6 con el cual p = 
20(0.6) = 12 y cr = V / 20(0.6)(0.4) = 2.19. Sobre el histograma de probabilidad se super¬ 
puso una curva normal con esas p y cr. Aunque el histograma de probabilidad es un poco 
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Figura 4.25 Histograma de probabilidad binomial para n = 20, p = 0.6 con curva de aproximación 
normal sobrepuesta. 


asimétrico (debido a que p 0.5), la curva normal da una muy buena aproximación, sobre 
todo en la parte media de la figura. El área de cualquier rectángulo (probabilidad de cual¬ 
quier valor X particular), excepto la de los localizados en las colas extremas, puede ser 
aproximada con precisión mediante el área de la curva normal correspondiente. Por ejem¬ 
plo, P(X = 10) = 5(10; 20, 0.6) — 5(9; 20, 0.6) = 0.117, mientras que el área bajo la curva 
normal entre 9.5 y 10.5 es P(— 1.14 < Z < —0.68) = 0.1212. 

En términos generales, en tanto que el histograma de probabilidad binomial no sea de¬ 
masiado asimétrico, las probabilidades binomiales pueden ser aproximadas muy bien por 
áreas de curva normal. Se acostumbra entonces decir que X tiene aproximadamente una dis¬ 
tribución normal. 


Sea X una variable aleatoria normal basada en n ensayos con probabilidad de éxito p. 
Luego si el histograma de probabilidad binomial no es demasiado asim étrico, X tiene 
aproximadamente una distribución normal con p = np y cr = V npq. En particular, 
con x = un valor posible de X, 


P{X < x) = 5(x; n, p) 


área bajo la curva normal \ 
a la izquierda de x + 0.5 i 


= <f> 


x + 0.5 — np 


En la práctica, la aproximación es adecuada siempre que tanto np > 10 como nq > 10, 
puesto que en ese caso existe bastante simetría en la distribución binomial subya¬ 
cente. 



Una comprobación directa de este resultado es bastante difícil. En el siguiente capítulo se ve¬ 
rá que es una consecuencia de un resultado más general llamado Teorema del Límite Central. 
Con toda honestidad, esta aproximación no es tan importante en el cálculo de probabilidad 
como una vez lo fue. Esto se debe a que los programas de computadora ahora son capaces 
de calcular probabilidades binomiales con exactitud con valores bastante grandes de n. 

Suponga que 25% de los conductores con licencia de manejo en un estado particular no 
están asegurados. Sea X el número de conductores no asegurados en una muestra aleato¬ 
ria de tamaño 50 (algo perversamente, un éxito es un conductor no asegurado), de modo que 
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p = 0.25. Entonces p = 12.5 y cr = 3.06. Como np = 50(0.25) = 12.5 > 10 y nq = 37.5 
> 10, la aproximación puede ser aplicada con seguridad: 

5(A < 10) = B( 10; 50, 0.25) « ^ 1Q + ^~ 12 ' 5 j 

= $(-0.65) = 0.2578 


Asimismo, la probabilidad de que entre 5 y 15 (inclusive) de los conductores seleccionados 
no estén asegurados es 


P (5 < A < 15) = 5(15; 50, 0.25) - 5(4; 50, 0.25) 


$1 


15.5 - 12.5 
3.06 


$1 


4.5 - 12.5 
3.06 


= 0.8320 


Las probabilidades exactas son 0.2622 y 0.8348, respectivamente, así que las aproximacio¬ 
nes son bastante buenas. En el último cálculo, la probabilidad 5(5 < X < 15) está siendo 
aproximada por el área bajo la curva normal entre 4.5 y 15.5, se utiliza la corrección de con¬ 
tinuidad tanto para el límite superior como para el inferior. ■ 


Cuando el objetivo de la investigación es hacer una inferencia sobre una proporción 
de población p, el interés se enfocará en la proporción muestral de X/n éxitos y no en X. Como 
esta proporción es exactamente X multiplicada por la constante Un, también tendrá apro¬ 
ximadamente una distribución normal (con media p = p y desviación estándar 
cr = ’Vpq/n), siempre que tanto np > 10 como nq >10. Esta aproximación normal es la base 
de varios procedimientos inferenciales que se discutirán en capítulos posteriores. 


EJERCICIOS Sección 4.3 (28-58) 


28. Sea Z una variable aleatoria normal estándar y calcule las 
siguientes probabilidades, trace las figuras siempre que sea 
apropiado. 

a. 5(0 <Z< 2.17) 

b. 5(0 < Z < 1) 

c. 5(-2.50<Z<0) 

d. 5(-2.50 < Z < 2.50) 

e. 5(Z< 1.37) 

f. 5(-1.75 < Z) 

g. 5(-1.50 < Z < 2.00) 

h. 5(1.37 <Z< 2.50) 

i. 5(1.50 <Z) 

j. 5( | Z | <2.50) 

29. En cada caso, determine el valor de la constante c que hace 
que el enunciado de probabilidad sea correcto. 

a. <f>(c) = 0.9838 

b. 5(0<Z<c) = 0.291 

c. 5(c < Z) = 0.121 

d. 5(-c < Z < c) = 0.668 

e. 5(c< | Z |) = 0.016 

30. Encuentre los siguientes percentiles de la distribución 
normal estándar. Interpole en los casos en que sea apro¬ 
piado. 

a. 91 a b. 9 a c. 75 a 

d. 25 a e. 6 a 


31. Determine z a para lo siguiente: 

a. a = 0.0055 b. a = 0.09 
c. a = 0.663 

32. Si X es una variable aleatoria normal con media 80 y des¬ 
viación estándar 10, calcule las siguientes probabilidades 
mediante estandarización: 

a. 5(A < 100) b. 5(A < 80) 

c. 5(65 < X < 100) d. 5(70 < X) 

e. 5(85 < A < 95) f. 5( | A - 80 | < 10) 

33. Suponga que la fuerza que actúa en una columna que ayu¬ 
da a soportar un edificio está normalmente distribuida con 
media de 15.0 kips y desviación estándar de 1.25 kips. 
¿Cuál es la probabilidad de que la fuerza 

a. sea de más de 18 kips? 

b. esté entre 10 y 12 kips? 

c. Difiera de 15.0 kips en cuando mucho 1.5 desviaciones 
estándar? 

34. El artículo “Reliability of Domestic-Waste Biofilm Reactors” 
( J. ofEnvir. Engr., 1995: 785-790) sugiere que la concentra¬ 
ción de sustrato (mg/cm 1 ) del afluente que llega a un reactor 
está normalmente distribuida con p = 0.30 y cr = 0.06. 

a. ¿Cuál es la probabilidad de que la concentración exceda 
de 0.25? 

b. ¿Cuál es la probabilidad de que la concentración sea 
cuando mucho de 0.10? 

c. ¿Cómo caracterizaría el 5% más grande de todos los va¬ 
lores de concentración? 
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35. Suponga que el diámetro a la altura del pecho (pulg) de ár¬ 
boles de un tipo está normalmente distribuido con ¿i = 8.8 
y a = 2.8 como se sugiere en el artículo “Simulating a Har- 
vester-Forwarder Softwood Thinning” ( Forest Products J. 
mayo de 1997; 36-41). 

a. ¿Cuál es la probabilidad de que el diámetro de un árbol 
seleccionado al azar sea por lo menos de 10 pulg? 
¿Mayor de 10 pulg? 

b. ¿Cuál es la probabilidad de que el diámetro de un árbol 
seleccionado al azar sea de más de 20 pulg? 

c. ¿Cuál es la probabilidad de que el diámetro de un árbol 
seleccionado al azar esté entre 5 y 10 pulg? 

d. ¿Qué valor c es tal que el intervalo (8.8 — c, 8.8 + c) in¬ 
cluya 98% de todos los valores de diámetro? 

e. Si se seleccionan cuatro árboles al azar, ¿cuál es la pro¬ 
babilidad de que por lo menos uno tenga un diámetro de 
más de 10 pulg? 

36. La deriva de las atomizaciones de pesticidas es una preocu¬ 
pación constante de los fumigadores y productores agrícolas. 
La relación inversa entre el tamaño de gota y el potencial de 
deriva es bien conocida. El artículo “Effects of 2,4-D Formu- 
lation and Quinclorac on Spray Droplet Size and Deposition” 
( Weed Technology, 2005: 1030-1036) investigó los efectos de 
formulaciones de herbicidas en atomizaciones. Una figura en 
el artículo sugirió que la distribución normal con media de 
1050 ¿un y desviación estándar de 150 ¿un fue un modelo ra¬ 
zonable de tamaño de gotas de agua (el “tratamiento de con¬ 
trol”) pulverizada a través de una boquilla de 760 ml/min. 

a. ¿Cuál es la probabilidad de que el tamaño de una sola go¬ 
ta sea de menos de 1500 ¿un? ¿Por lo menos de 1000 ¿un? 

b. ¿Cuál es la probabilidad de que el tamaño de una sola 
gota esté entre 1000 y 1500 ¿un? 

c. ¿Cómo caracterizaría el 2% más pequeño de todas las 
gotas? 

d. Si se miden los tamaños de cinco gotas independiente¬ 
mente seleccionadas, ¿cuál es la probabilidad de que por 
lo menos una exceda de 1500 ¿un? 

37. Suponga que la concentración de cloruro en sangre (mmol/L) 
tiene una distribución normal con media de 104 y desvia¬ 
ción estándar de 5 (información en el artículo "Matemathi- 
cal Model of Chloride Concentration in Human Blood”, 
J. ofMed. Engr. and Tech., 2006; 25-30, incluida una gráfica 
de probabilidad normal como se describe en la sección 4.6, 
apoyando esta suposición). 

a. ¿Cuál es la probabilidad de que la concentración de clo¬ 
ruro sea igual a 105? ¿Sea menor que 105? ¿Sea cuando 
mucho de 105? 

b. ¿Cuál es la probabilidad de que la concentración de clo¬ 
ruro difiera de la media por más de una desviación están¬ 
dar? ¿Depende esta probabilidad de los valores de ¿i y <x? 

c. ¿Cómo caracterizaría el 0.1% más extremo de los valores 
de concentración de cloruro? 

38. Hay dos máquinas disponibles para cortar corchos para usarse 
en botellas de vino. La primera produce corchos con diáme¬ 
tros que están normalmente distribuidos con media de 3 cm y 
desviación estándar de 0.1 cm. La segunda máquina produce 
corchos con diámetros que tienen una distribución normal con 
media de 3.04 cm y desviación estándar de 0.02 cm. Los cor- 
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chos aceptables tienen diámetros entre 2.9 y 3.1 cm. ¿Cuál 
máquina es más probable que produzca un corcho aceptable? 

39. a. Si una distribución normal tiene ¿i = 30 y cr = 5, ¿cuál 

es el 91° percentil de la distribución? 

b. ¿Cuál es el 6 o percentil de la distribución? 

c. El ancho de una línea grabada en un “chip” de circuito in¬ 
tegrado normalmente está distribuida con media de 3.000 
¿un y desviación estándar de 0.140. ¿Qué valor de ancho 
separa 10% de las líneas más anchas del 90% restante? 

40. El artículo “Monte Cario Simulation-Tool for Better Un- 
derstanding of LRFD” (J. Structural Engr., 1993: 1586- 
1599) sugiere que la resistencia a ceder (lb/pulg 2 ) de un 
acero grado A36 está normalmente distribuida con ¿i = 43 
ya — 4.5. 

a. ¿Cuál es la probabilidad de que la resistencia a ceder sea 
cuando mucho de 40? ¿De más de 60? 

b. ¿Qué valor de resistencia a ceder separa al 75% más re¬ 
sistente del resto? 

41. El dispositivo de apertura automática de un paracaídas de 
carga militar se diseñó para que abriera el paracaídas a 200 m 
sobre el suelo. Suponga que la altitud de abertura en realidad 
tiene una distribución normal con valor medio de 200 m y 
desviación estándar de 30 m. La carga útil se dañará si el 
paracaídas se abre a menos de 100 m. ¿Cuál es la probabi¬ 
lidad de que se dañe la carga útil de cuando menos uno de 
cinco paracaídas lanzados en forma independiente? 

42. La lectura de temperatura tomada con un termopar colocado 
en un medio a temperatura constante normalmente está dis¬ 
tribuida con media ¿i, la temperatura real del medio y la des¬ 
viación estándar a. ¿Qué valor tendría a para asegurarse de 
que el 95% de todas las lecturas están dentro de 0.1° de ¿i? 

43. Se sabe que la distribución de resistencia de resistores de un 
tipo es normal y la resistencia del 10% de ellos es mayor de 
10.256 ohms y la del 5% es de una resistencia menor de 9.671 
ohms. ¿Cuáles son el valor medio y la desviación estándar de 
la distribución de resistencia? 

44. Si la longitud roscada de un perno está normalmente distri¬ 
buida, ¿cuál es la probabilidad de que la longitud roscada de 
un perno seleccionado al azar esté 

a. dentro de 1.5 desviaciones estándar de su valor medio? 

b. a más de 2.5 desviaciones estándar de su valor medio? 

c. entre una y dos desviaciones estándar de su valor medio? 

45. Una máquina que produce cojinetes de bolas inicialmente se 
ajustó de modo que el diámetro promedio verdadero de los 
cojinetes que produce sea de 0.500 pulg. Un cojinete es 
aceptable si su diámetro está dentro de 0.004 pulg de su va¬ 
lor objetivo. Suponga, sin embargo, que el ajuste cambia du¬ 
rante el curso de la producción, de modo que los cojinetes 
tengan diámetros normalmente distribuidos con valor medio 
de 0.499 pulg y desviación estándar de 0.002 pulg. ¿Qué 
porcentaje de los cojinetes producidos no será aceptable? 

46. La dureza Rockwell de un metal se determina hincando una 
punta endurecida en la superficie del metal y luego midien¬ 
do la profundidad de penetración de la punta. Suponga que 
la dureza Rockwell de una aleación particular está normal¬ 
mente distribuida con media de 70 y desviación estándar de 
3. (La dureza Rockwell se mide en una escala continua.) 
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a. Una probeta es aceptable sólo si su dureza oscila entre 
67 y 75, ¿cuál es la probabilidad de que una probeta se¬ 
leccionada al azar tenga una dureza aceptable? 

b. Si el rango de dureza aceptable es (70 — c, 70 + c), ¿con 
qué valor de c tendría 95% de todas las probetas una du¬ 
reza aceptable? 

c. Si el rango de dureza aceptable es como el del inciso a) 
y la dureza de cada una de diez probetas seleccionadas 
al azar se determina de forma independiente, ¿cuál es el 
valor esperado de probetas aceptables entre las diez? 

d. ¿Cuál es la probabilidad de que cuando mucho ocho de 
diez probetas independientemente seleccionadas tengan 
una dureza de menos de 73.84? [Sugerencia: Y = el nú¬ 
mero de entre las diez probetas con dureza de menos de 
73.84 es una variable binomial; ¿cuál es p7\ 

47. La distribución de peso de paquetes enviados de cierta ma¬ 
nera es normal con valor medio de 12 Ib y desviación están¬ 
dar de 3.5 Ib. El servicio de paquetería desea establecer 
un valor de peso c más allá del cual habrá un cargo extra. 
¿Qué valor de c es tal que 99% de todos los paquetes estén 
por lo menos 1 Ib por debajo del peso de cargo extra? 

48. Suponga que la tabla A.3 del apéndice contiene <í>(;) sólo 
para z — 0. Explique cómo aún así podría calcular 

a. P(-l.72 < Z< -0.55) 

b. P(-1.72 £Z< 0.55) 

¿Es necesario tabular <í>(z) para z negativo? ¿Qué propiedad 
de la curva normal estándar justifica su respuesta? 

49. Considere los bebés nacidos en el rango “normal” de 37-43 
semanas de gestación. Datos extensos sustentan la suposi¬ 
ción de que el peso de nacimiento de estos bebés nacidos en 
Estados Unidos está normalmente distribuido con media de 
3432 g y desviación estándar de 482 g. [El artículo “Are Ba- 
bies Normal?” {The American Statistician (1999): 298-302) 
analizó datos de un año particular; con una selección sensi¬ 
ble de intervalos de clase, un histograma no parecía del todo 
normal pero después de una investigación se determinó que 
esto se debía a que en algunos hospitales medían el peso en 
gramos, en otros lo medían a la onza más cercana y luego lo 
convertían en gramos. Una selección modificada de interva¬ 
los de clase que permitía esto produjo un histograma que era 
descrito muy bien por una distribución normal.] 

a. ¿Cuál es la probabilidad de que el peso de nacimiento de 
un bebé seleccionado al azar de este tipo exceda de 4 000 
gramos? ¿Esté entre 3 000 y 4 000 gramos? 

b. ¿Cuál es la probabilidad de que el peso de nacimiento de 
un bebé seleccionado al azar de este tipo sea de menos 
de 2 000 gramos o de más de 5 000 gramos? 

c. ¿Cuál es la probabilidad de que el peso de nacimiento 
de un bebé seleccionado al azar de este tipo exceda de 
7 libras? 

d. ¿Cómo caracterizaría el 0.1 % más extremo de todos los 
pesos de nacimiento? 

e. Si X es una variable aleatoria con una distribución nor¬ 
mal y a es una constante numérica ( a ri 0), entonces 
Y = aX también tiene una distribución normal. Use esto 
para determinar la distribución de pesos de nacimiento 
expresados en libras (forma, media y desviación están- 


probabilidad 

dar) y luego calcule otra vez la probabilidad del inciso c) 
¿Cómo se compara ésta con su respuesta previa? 

50. En respuesta a preocupaciones sobre el contenido nutricional 
de las comidas rápidas. McDonald’s ha anunciado que utili¬ 
zará un nuevo aceite de cocinar para sus papas a la francesa 
que reducirá sustancialmente los niveles de ácidos grasos e 
incrementará la cantidad de grasa poliinsaturada más benéfi¬ 
ca. La compañía afirma que 97 de 100 personas no son capa¬ 
ces de detectar una diferencia de sabor entre los nuevos y los 
viejos aceites. Suponiendo que esta cifra es correcta (como 
proporción de largo plazo) ¿cuál es la probabilidad aproxi¬ 
mada de que en una muestra aleatoria de 1000 individuos que 
han comprado papas a la francesa en McDonald’s: 

a. ¿Por lo menos 40 puedan notar la diferencia de sabor en¬ 
tre los dos aceites? 

b. Cuando mucho 5% pueda notar la diferencia de sabor 
entre los dos aceites? 

51. La desigualdad de Chebyshev (véase el ejercicio 44 del 
capítulo 3), es válida para distribuciones continuas y dis¬ 
cretas. Estipula que para cualquier número k que satisfaga 
k ^ 1, P(\X — ju, | a kcr) £ l/k 2 (véase el ejercicio 44 en 
el capítulo 3 para una interpretación). Obtenga esta proba¬ 
bilidad en el caso de una distribución normal con k= 1,2, 
3 y compare con el límite superior. 

52. Sea X el número de defectos en un carrete de cinta magné¬ 
tica de 100 m (una variable de valor entero). Suponga que 
X tiene aproximadamente una distribución normal con /j, = 
25 y <r = 5. Use la corrección por continuidad para calcu¬ 
lar la probabilidad de que el número de defectos sea: 

a. Entre 20 y 30, inclusive. 

b. Cuando mucho 30. Menos de 30. 

53. Si X tiene una distribución binomial con parámetros n = 25 y 

р, calcule cada una de las siguientes probabilidades mediante 
la aproximación normal (con la corrección por continuidad) 
en los casos p = 0.5, 0.6, y 0.8 y compare con las probabili¬ 
dades exactas calculadas con la tabla A. 1 del apéndice. 

a. P(15 20) 

b. P(X< 15) 

с. P {20 < A) 

54. Suponga que 10% de todas las flechas de acero producidas 
por medio de un proceso no cumplen con las especificacio¬ 
nes pero pueden ser retrabajadas (en lugar de ser desecha¬ 
das). Considere una muestra aleatoria de 200 flechas y sea 
X el número entre éstas que no cumplen con las especifica¬ 
ciones y pueden ser retrabajadas. ¿Cuál es la probabilidad 
aproximada de que X sea 

a. Cuando mucho 30? 

b. Menos que 30? 

c. Entre 15 y 25 (inclusive)? 

55. Suponga que sólo 75% de todos los conductores en un esta¬ 
do usan con regularidad el cinturón de seguridad. Se selec¬ 
ciona una muestra aleatoria de 500 conductores. ¿Cuál es la 
probabilidad de que 

a. Entre 360 y 400 (inclusive) de los conductores en la 
muestra usen con regularidad el cinturón de seguridad? 

b. Menos de 400 de aquellos en la muestra usen con regu¬ 
laridad el cinturón de seguridad? 
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56. Demuestre que la relación entre un percentil normal gene¬ 
ral y el percentil z correspondiente es como se estipuló en 
esta sección. 

57. a. Demuestre que si X tiene una distribución normal con 

parámetros ¡jl y cr, entonces Y = aX + b (una función li¬ 
neal de X) también tiene una distribución normal. ¿Cuá¬ 
les son los parámetros de la distribución de Y [es decir, 
E(Y) y V{Y)]1 [Sugerencia: Escriba la función de distri¬ 
bución acumulativa de Y, P(Y £ y), como una integral 
que implique la función de densidad de probabilidad de 
X y luego derive con respecto a y para obtener la función 
de densidad de probabilidad de Y.] 
b. Si cuando se mide en °C, la temperatura está normal¬ 
mente distribuida con media de 115 y desviación están¬ 
dar de dos, ¿qué se puede decir sobre la distribución de 
temperatura medida en °F? 
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58. No existe una fórmula exacta para función de distribución 
acumulativa normal estándar <t>(z), aunque se han publicado 
varias aproximaciones en artículos. La siguiente se tomó de 
“Approximations for Hand Calculators Using Small Integer 
Coefficients” (Mathematics of Computation, 1977: 214- 
222). Con 0 < z < 5.5, 

P(Z > z) = 1 - ®(z) 

~ (83z + 351); + 562 1| 

703/z + 165 

El error relativo de esta aproximación es de menos de 0.042%. 
Úsela para calcular aproximaciones a las siguientes probabi¬ 
lidades y compare siempre que sea posible con las probabili¬ 
dades obtenidas con la tabla A.3 del apéndice, 
a. P(Z> I) b. P(Z < -3) 

c. P(-4 < Z < 4) d. P(Z > 5) 



4.4 Distribuciones exponencial y gama 


La curva de densidad correspondiente a cualquier distribución normal tiene forma de campa¬ 
na y por consiguiente es simétrica. Existen muchas situaciones prácticas en las cuales la va¬ 
riable de interés para un investigador podría tener una distribución asimétrica. Una familia de 
distribuciones que tiene esta propiedad es la familia gama. Primero se considera un caso es¬ 
pecial, la distribución exponencial y luego se le generaliza más adelante en esta sección. 

Distribución exponencial 

La familia de distribuciones exponenciales proporciona modelos de probabilidad que son 
muy utilizados en disciplinas de ingeniería y ciencias. 



DEFINICIÓN 


Se dice que X tiene una distribución exponencial con parámetro A (A > 0) si la fun¬ 
ción de densidad de probabilidad de X es 

ÍAe _Aj: r>0 

0 de lo contrario (4.5) 


/(x; A) = 


Algunas fuentes escriben la función de densidad de probabilidad exponencial en la forma 
(1 de modo que /3 = 1/A. El valor esperado de una variable aleatoria exponencial¬ 

mente distribuida X es 

E(X) = f x Ae~ Al dx 

Jo 


Para obtener este valor esperado se requiere integrar por partes. La varianza de X se calcula 
utilizando el hecho de que V(X) = E(X 2 ) — \E(X)] 2 . La determinación de E(X 2 ) requiere inte¬ 
grar por partes dos veces en sucesión. Los resultados de estas integraciones son los siguientes: 


Tanto la media como la desviación estándar de la distribución exponencial son iguales a 1/A. 
En la figura 4.26 aparecen algunas gráficas de varias funciones de densidad de probabilidad 
exponenciales. 
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Figura 4.26 Curvas de densidad exponencial. 

La función de densidad de probabilidad exponencial es fácil de integrar para obtener la fun¬ 
ción de densidad acumulativa. 


F(pc; A) 


í 0 x < 0 
11 — e~ Xx x > 0 


Ejemplo 4.21 Suponga que el tiempo de respuesta X en una terminal de computadora en línea (el tiempo 
transcurrido entre el final de la consulta de un usuario y el inicio de la respuesta del siste¬ 
ma a dicha consulta) tiene una distribución exponencial con tiempo de respuesta esperado 
de 5 s. Entonces E(X) = 1/A = 5, por lo tanto A = 0.2. La probabilidad de que el tiempo de 
respuesta sea cuando mucho de 10 s es 

P(X < 10) = F(10; 0.2) = 1 - e-M 1 ® = 1 - e“ 2 = 1 - 0.135 = 0.865 
La probabilidad de que el tiempo de respuesta sea de entre 5 y 10 s es 
P( 5 < X < 10) = F(10; 0.2) - F( 5; 0.2) 

= (1 - e- 2 ) - (1 - e- 1 ) = 0.233 ■ 

La distribución exponencial se utiliza con frecuencia como modelo de la distribución 
de tiempos entre la ocurrencia de eventos sucesivos, tales como clientes que llegan a una 
instalación de servicio o llamadas que entran a un conmutador. La razón de esto es que la 
distribución exponencial está estrechamente relacionada con el proceso de Poisson discuti¬ 
do en el capítulo 3. 


PROPOSICIÓN 


Suponga que el número de eventos que ocurren en cualquier intervalo de tiempo de 
duración t tiene una distribución de Poisson con parámetro at (donde a, la razón del 
proceso de eventos, es el número esperado de eventos que ocurren en una unidad de 
tiempo) y que los números de ocurrencias en intervalos no traslapantes son indepen¬ 
dientes uno de otro. Entonces la distribución del tiempo transcurrido entre la ocu¬ 
rrencia de dos eventos sucesivos es exponencial con parámetro A = a. 


Aunque una comprobación completa queda fuera del alcance de este libro, el resultado es 
fácil de verificar para el tiempo X¡ hasta que ocurre el primer evento: 

P(X l < i) = 1 — l > (X [ > t) = 1 — P[ningún evento en (0, /)] 


0 ! 

la cual es exactamente la función de distribución acumulativa de la distribución exponencial. 
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Ejemplo 4.22 


e 


DEFINICIÓN 
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Suponga que se reciben llamadas durante las 24 horas en una “línea de emergencia para pre¬ 
vención del suicidio” de acuerdo con un proceso de Poisson a razón a = 0.5 llamadas por 
día. Entonces el número de días X entre llamadas sucesivas tiene una distribución exponen¬ 
cial con valor de parámetro 0.5, así que la probabilidad de que transcurran más de dos días 
entre llamadas es 

P(X > 2) = 1 - P(X < 2) = 1 - F{ 2; 0.5) = = 0.368 

El tiempo esperado entre llamadas sucesivas es 1/0.5 = 2 días. ■ 


Otra aplicación importante de la distribución exponencial es modelar la distribución 
de la duración de un componente. Una razón parcial de la popularidad de tales aplicaciones 
es la propiedad de “ falta de memoria o amnesia” de la distribución exponencial. Supon¬ 
ga que la duración de un componente está exponencialmente distribuida con parámetro A. 
Después de poner el componente en servicio, se deja que pase un periodo de t 0 horas y lue¬ 
go se ve si el componente sigue trabajando; ¿cuál es ahora la probabilidad de que dure por 
lo menos t horas más? En símbolos, se desea P(X > t + t 0 | X > t 0 ). Por la definición de pro¬ 
babilidad condicional. 


P(X>t + t 0 \X>t 0 ) 


P[(X>r + r 0 )n(X>r 0 )] 

P(X > o 


Pero el evento X > í 0 en el numerador es redundante, puesto que ambos eventos pueden ocu¬ 
rrir si y sólo si X > t + t 0 . Por consiguiente, 


P(X > í 4- r 0 1X > r 0 ) 


P(X > t + f 0 ) 
P{X > t 0 ) 


1 - F(t + / 0 ; A) 
1 - E(r 0 ; A) 


Esta probabilidad condicional es idéntica a la probabilidad original P(X > t) de que el com¬ 
ponente dure t horas. Por lo tanto, la distribución de duración adicional es exactamente la 
misma que la distribución original de duración, así que en cada punto en el tiempo el com¬ 
ponente no muestra ningún efecto de desgaste. En otras palabras, la distribución de la dura¬ 
ción restante es independiente de la antigüedad actual. 

Aunque la propiedad de amnesia se justifica por lo menos en forma aproximada en 
muchos problemas aplicados, en otras situaciones los componentes se deterioran con el 
tiempo o de vez en cuando mejoran con él (por lo menos hasta cierto punto). Las distribu¬ 
ciones gama, Weibull y lognormales proporcionan modelos de duración más generales (las 
últimas dos se discuten en la siguiente sección). 


La función gama 

Para definir la familia de distribuciones gama, primero se tiene que introducir una función 
que desempeña un importante papel en muchas ramas de las matemáticas. 



Con a > 0, la función gama !”(«) se define como 

T(a) = i x“ _I e~ x dx 
Jo 


(4.6) 


Las propiedades más importantes de la función gama son las siguientes: 

1. Con cualquier a > 1, T(a) = (a — 1) • F(a — 1) [vía integración por partes]. 

2. Con cualquier entero positivo, n, T(n) = (n — 1)! 


3 . 
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De acuerdo con la expresión (4.6), si 

(x a ~ 1 e~ x 

... . ) —- x > 0 

/(x; a) = < I» (4 7) 

c 0 de lo contrario 

entonces/(x; a) > 0 y J“/(x; a) dx = r(a)/r(a) = 1, así que /(x; a) satisface las dos pro¬ 
piedades básicas de una función de densidad de probabilidad. 


DEFINICIÓN 


La distribución gama 


Se dice que una variable aleatoria continua X tiene una distribución gama si la fun¬ 
ción de densidad de probabilidad de X es 


/(x; a, /3) 


1 


I J8»r(a) 


X a t j://3 


0 


x > 0 

de lo contrario 


(4.8) 


donde los parámetros a y ¡3 satisfacen a > 0. [i > 0. La distribución gama están¬ 
dar tiene ¡3 = 1, así que (4.7) da la función de densidad de probabilidad de una va¬ 
riable aleatoria gama estándar. 


La distribución exponencial se deriva de considerar a = ly/3 = l/A. 

La figura 4.27(a) ilustra las gráficas de la función de densidad de probabilidad gama 
/(x; a , ¡3) (4.8) para varios pares (a, ¡3), en tanto que la figura 4.27(b) presenta gráficas de 
la función de densidad de probabilidad gama estándar. Para la función de densidad de pro¬ 
babilidad estándar cuando a < 1, /(x; a) es estrictamente decreciente a medida que x se in¬ 
crementa desde 0; cuando a > 1,/(x; a) se eleva desde 0 en x = 0 hasta un máximo y luego 
decrece. El parámetro ¡3 en (4.8) se llama parámetro de escala porque los valores diferen¬ 
tes de uno alargan o comprimen la función de densidad de probabilidad en la dirección x. 


ftx;a.p) f(x;a) 




(a) (b) 

Figura 4.27 (a) Curvas de densidad gama; (b) Curvas de densidad gama estándar. 


La media y la varianza de una variable aleatoria X que tiene la distribución gama /íx; a, ¡3) son 
E(X) = p. = af3 V(X) = a 2 = a¡3 2 

Cuando X es una variable aleatoria gama estándar, la función de distribución acumu¬ 
lativa de X, 


F(x; a) = 


f 

J o 


y a ~ l e~ y 

T(a) 


dy x > 0 


(4.9) 
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se llama función gama incompleta [en ocasiones la función gama incompleta se refiere a 
la expresión (4.9) sin el denominador Lía) en el integrando]. Existen tablas extensas de F(x\ a) 
disponibles; en la tabla A.4 del apéndice se presenta una pequeña tabulación para a = 1, 
2, . . . , 10 y x = 1, 2, . . ., 15. 

Ejemplo 4.23 Suponga que el tiempo de reacción X de un individuo seleccionado al azar a un estímulo tie¬ 
ne una distribución gama estándar con a = 2. Como 

P(a<X<b) = F(b ) - F(a ) 


cuando X es continua, 

P( 3 < A < 5) = F( 5; 2) - F( 3; 2) = 0.960 - 0.801 = 0.159 
La probabilidad de que el tiempo de reacción sea de más de 4 s es 

P(X > 4) = 1 — P(X < 4) = 1 — F( 4; 2) = 1 - 0.908 = 0.092 

La función gama incompleta también se utiliza para calcular probabilidades que im¬ 
plican distribuciones gama no estándar. Estas probabilidades también se obtienen casi ins¬ 
tantáneamente con varios paquetes de software. 



PROPOSICIÓN 


Si X tiene una distribución gama con parámetros ay ¡3 entonces con cualquier x > 0, 
la función de distribución acumulativa de X es 

P(X < x) = F(x-, a, ¡3) = F¡~', a 

donde F(-; a) es la función gama incompleta. 



Ejemplo 4.24 Suponga que el tiempo de sobrevivencia de un ratón macho seleccionado al azar expuesto a 
240 rads de radiación gama tiene una distribución gama con a = 8 y ¡3 = 15. (Datos en Sur- 
vi val Distributions: Reliability Applications in the Biomedical Services, de A. J. Gross y 
V. Clark, sugiere a ~ 8.5 y ¡3 ~ 13.3.) El tiempo de sobrevivencia espera do es E(X) = 
(8)(15) = 120 semanas, en tanto que V(X) = (8)(15) 2 = 1800 y cr x = V1800 = 42.43 
semanas. La probabilidad de que un ratón sobreviva entre 60 y 120 semanas es 

P{ 60 < X < 120) = P(X < 120) - P(X < 60) 

= F(120/15; 8) - F(60/15; 8) 

= F( 8; 8) - F( 4; 8) = 0.547 - 0.051 = 0.496 

La probabilidad de que un ratón sobreviva por lo menos 30 semanas es 

P(X > 30) = 1 - P(X < 30) = 1 - P(X < 30) 

= 1 - F(30/15; 8) = 0.999 ■ 

Distribución ji cuadrada 

La distribución ji cuadrada es importante porque es la base de varios procedimientos de in¬ 
ferencia estadística. El papel central desempeñado por la distribución ji cuadrada en infe¬ 
rencia se deriva de su relación con distribuciones normales (véase el ejercicio 71). Se 
discutirá esta distribución con más detalle en capítulos posteriores. 
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DEFINICIÓN 


Sea v un entero positivo. Se dice entonces que una variable aleatoria X tiene una dis¬ 
tribución ji cuadrada con parámetro v si la función de densidad de probabilidad de 
X es la densidad gama con a = v/2 y ¡i = 2. La función de densidad de probabilidad 
de una variable aleatoria ji cuadrada es por lo tanto 


/(*; v) 


1 


= \ 2 vl2 T(v/2) 


x (vl2)-l e ~xl2 


X > 0 

x < 0 


(4.10) 


El parámetro v se llama número de grados de libertad (gl) de X. A menudo se uti¬ 
liza el símbolo X~ en lugar de “ji cuadrada”. 


EJERCICIOS Sección 4.4 (59-71) 


59. Sea X = el tiempo entre dos llegadas sucesivas a la ventanilla 
de autopago de un banco local. Si X tiene una distribución ex¬ 
ponencial con A = 1 (la cual es idéntica a una distribución 
gama estándar con a = 1), calcule lo siguiente: 

a. El tiempo esperado entre dos llegadas sucesivas. 

b. La desviación estándar del tiempo entre dos llegadas su¬ 
cesivas. 

c. P(X< 4) 

d. P(2 < X < 5) 

60. Sea X la distancia (m) que un animal recorre desde el sitio de 
su nacimiento hasta el primer territorio vacante que encuen¬ 
tra. Suponga que ratas canguro con etiqueta en la cola, X tie¬ 
ne una distribución exponencial con parámetro A = 0.01386 
(como lo sugiere el artículo “Competition and Dispersal from 
Múltiple Nests”, Ecology, 1997: 873-883). 

a. ¿Cuál es la probabilidad de que la distancia sea cuando 
mucho de 100 m? ¿Cuándo mucho de 200? ¿Entre 100 
y 200 m? 

b. ¿Cuál es la probabilidad de que la distancia exceda la 
distancia media por más de dos desviaciones estándar? 

c. ¿Cuál es el valor de la distancia mediana? 

61. La amplia experiencia con ventiladores de un tipo utiliza¬ 
dos en motores diesel ha sugerido que la distribución ex¬ 
ponencial proporciona un buen modelo del tiempo hasta 
la falla. Suponga que el tiempo medio hasta la falla es de 
25 000 horas. ¿Cuál es la probabilidad de que 

a. Un ventilador seleccionado al azar dure por lo menos 
20 000 horas? ¿Cuándo mucho 30 000 horas? ¿Entre 
20 000 y 30 000 horas? 

b. ¿Exceda la duración de un ventilador el valor medio por 
más de dos desviaciones estándar? ¿Más de tres desvia¬ 
ciones estándar? 

62. El artículo “Microwave Observations of Daily Antarctic Sea- 
Ice Edge Expansión and Contribution Rates” (IEEE Geosci. 
and Remóte Sensing Letters, 2006: 54-58) establece que “la 
distribución del avance/retroceso diarios del hielo marino con 
respecto a cada sensor es similar y es aproximadamente una 
exponencial doble”. La distribución exponencial doble pro¬ 
puesta tiene una función de densidad f(x) = 0.5Ae” x W para 
— 00 < x < 00 . La desviación estándar se da como 40.9 km. 


a. ¿Cuál es el valor del parámetro A? 

b. ¿Cuál es la probabilidad de que la extensión del cambio 
del hielo marino esté dentro de una desviación estándar del 
valor medio? 

63. Un consumidor está tratando de decidir entre dos planes de 
llamadas de larga distancia. El primero aplica una sola tari¬ 
fa de 100 por minuto, en tanto que el segundo cobra una ta¬ 
rifa de 990 por llamadas hasta de 20 minutos y luego 100 
por cada minuto adicional que exceda de 20 (suponga que 
las llamadas que duran un número no entero de minutos son 
cobradas proporcionalmente a un cargo por minuto entero). 
Suponga que la distribución de duración de llamadas del 
consumidor es exponencial con parámetro A. 

a. Explique intuitivamente cómo la selección del plan de llama¬ 
das deberá depender de cuál sea la duración de las llamadas. 

b. ¿Cuál plan es mejor si la duración esperada de las llama¬ 
das es de 10 minutos? ¿Y de 15 minutos? [ Sugerencia : 
Sea h\(x) el costo del primer plan cuando la duración 
de las llamadas es de x minutos y sea h 2 (x) la función de 
costo del segundo plan. Dé expresiones para estas dos 
funciones de costo y luego determine el costo esperado 
de cada plan.] 

64. Evalúe lo siguiente: 

a. T(6) b. T(5/2) 

c. F(4; 5) (la función gama incompleta) 

d. F(5; 4) e. F(0; 4) 

65. Si X tiene una distribución gama estándar con a = 7 evalúe 
lo siguiente: 

a. P(X < 5) b. P(X < 5) c. P(X > 8) 

d. P (3 < Y < 8) e. F(3 < X < 8) 
f. P{X < 4 o X > 6) 

66. Suponga que el tiempo empleado por un estudiante seleccio¬ 
nado al azar que utiliza una terminal conectada a un sistema 
de computadoras de tiempo compartido tiene una distribu¬ 
ción gama con media de 20 min y varianza de 80 min 2 . 

a. ¿Cuáles son los valores de a y /3? 

b. ¿Cuál es la probabilidad de que un estudiante utilice la 
terminal durante cuando mucho 24 min? 

c. ¿Cuál es la probabilidad de que un estudiante utilice la 
terminal durante entre 20 y 40 min? 
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67. Suponga que cuando un transistor de cierto tipo se somete 
a una prueba de duración acelerada, la duración X (en sema¬ 
nas) tiene una distribución gama acelerada con media de 24 
semanas y desviación estándar de 12 semanas. 

a. ¿Cuál es la probabilidad de que un transistor dure entre 
12 y 24 semanas? 

b. ¿Cuál es la probabilidad de que un transistor dure cuan¬ 
do mucho 24 semanas? ¿Es la mediana de la distribu¬ 
ción de duración menor que 24? ¿Por qué si o por qué 
no? 

c. ¿Cuál es el 99° percentil de la distribución de duración? 

d. Suponga que la prueba termina en realidad después de t 
semanas. ¿Qué valor de t es tal que sólo el 0.5% de todos 
los transistores continuarán funcionando al término de la 
prueba? 

68. El caso especial de la distribución gama en la cual a es un 
entero positivo n se llama distribución Erlang. Si se reem¬ 
plaza fí por 1/A en la expresión (4.8), la función de densi¬ 
dad de probabilidad Erlang es 

Í A(A xr~ l e->* 
f(x-,\,n)=S (n — 1)! 

[ 0 x <0 

Se puede demostrar que si los tiempos entre eventos sucesi¬ 
vos son independientes, cada uno con distribución exponen¬ 
cial con parámetro A, entonces el tiempo total que transcurre 
antes de que ocurran los siguientes n eventos tiene una fun¬ 
ción de densidad de probabilidad^*; A, rí). 

a. ¿Cuál es el valor esperado de XI Si el tiempo (en minu¬ 
tos) entre llegadas de clientes sucesivos está exponen¬ 
cialmente distribuido con A = 0.5, ¿cuánto tiempo se 
puede esperar que transcurra antes de que llegue el déci¬ 
mo cliente? 

b. Si el tiempo entre llegadas de clientes está exponencial¬ 
mente distribuido con A = 0.5, ¿cuál es la probabilidad 
de que el décimo cliente (después del que acaba de lle¬ 
gar) llegue dentro de los siguientes 30 min? 

c. El evento [X :£ /] ocurre si y sólo si ocurren n eventos 
en el siguiente t. Use el hecho de que el número de even¬ 
tos que ocurren en un intervalo de duración t tiene una 
distribución de Poisson con parámetro At para escribir 
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una expresión (que implique probabilidades de Poisson) 
para la función de distribución acumulativa de Erlang 
F(t- A, n) = P(X < i). 

69. Un sistema consta de cinco componentes idénticos conecta¬ 
dos en serie como se muestra: 

— i —□□—m— 4 —□□— 

En cuanto un componente falla, todo el sistema lo hace. Su¬ 
ponga que cada componente tiene una duración que está ex¬ 
ponencialmente distribuida con A = 0.01 y que los 
componentes fallan de manera independiente uno de otro. 
Defina los eventos A¡ = {el componente Pésimo dura por lo 
menos t horas}, i = 1, . . . , 5, de modo que los A¡ son even¬ 
tos independientes. Sea X = el tiempo al cual el sistema fa¬ 
lla, es decir, la duración más corta (mínima) entre los cinco 
componentes. 

a. ¿A qué evento equivale el evento {A a t) que implique 
A,, . . . , A 5 ? 

b. Utilizando la independencia de los eventos A¡, calcule 
P(X > t). Luego obtenga F{t ) = P(X < f) y la función 
de densidad de probabilidad de X. ¿Qué tipo de distribu¬ 
ción tiene XI 

c. Suponga que existen n componentes y cada uno tiene 
una duración exponencial con parámetro A. ¿Qué tipo de 
distribución tiene XI 

70. Si X tiene una distribución exponencial con parámetro A, 
deríve una expresión general para el (100p)° percentil de la 
distribución. Luego especifique cómo obtener la mediana. 

71. a. ¿A qué evento equivale el evento {A 2 £ v} que implique 

a X misma? 

b. Si X tiene una distribución normal estándar, use el inciso 
a) para escribir la integral que es igual a P^X 2 £ y). Lue¬ 
go derive con respecto a y para obtener la función de den¬ 
sidad de probabilidad de X 1 [el cuadrado de una variable 
ÍV(0, 1)]. Por último, demuestre que X 2 tiene una 
distribución ji cuadrada con v = 1 grados de libertad 
[véase (4.10)]. [Sugerencia: Use la siguiente identidad.] 

f/v { ia(y)^ dx ] ' fc'OO - /[aOO] ' a'(y) 


4.5 Otras distribuciones continuas 


Las familias de distribuciones normal, gama (incluida la exponencial) y uniforme propor¬ 
cionan una amplia variedad de modelos de probabilidad de variables continuas, pero exis¬ 
ten muchas situaciones prácticas en las cuales ningún miembro de estas familias se adapta 
bien a un conjunto de datos observados. Los estadísticos y otros investigadores han desarro¬ 
llado otras familias de distribuciones que a menudo son apropiadas en la práctica. 

Distribución Weibull 

El físico sueco Waloddi Weibull introdujo la familia de distribuciones Weibull en 1939; su 
artículo de 1951 “A Statistical Distribution Function of Wide Applicability” ( J. Applied Me- 
chanics, vol. 18: 293-297) discute varias aplicaciones. 





































CAPITULO 4 Variables aleatorias continuas y distribuciones de probabilidad 


DEFINICIÓN 


Ejemplo 4.25 


Se dice que una variable aleatoria X tiene una distribución Weibull con parámetros 
a y ¡3 (a > 0, ¡3 > 0) si la función de densidad de probabilidad de X es 


f(x; a, ¡3) 


a 

13 a 


0 


x > 0 


x < 0 


(4.11) 


En algunas situaciones, existen justificaciones teóricas para la pertinencia de la distri¬ 
bución Weibull, pero en muchas aplicaciones/(x; a, ¡3) simplemente proporciona una con¬ 
cordancia con los datos observados con valores particulares de a y ¡3. Cuando a = 1, la 
función de densidad de probabilidad se reduce a la distribución exponencial (con A = 1//3), 
de modo que la distribución exponencial es un caso especial tanto de la distribución gama 
como de la distribución Weibull. No obstante, existen distribuciones gama que no son Wei¬ 
bull y viceversa, por lo que una familia no es un subconjunto de la otra. Tanto a como (3 
pueden ser variadas para obtener diferentes formas distribucionales, como se ilustra en la fi¬ 
gura 4.28. /3 es un parámetro de escala, así que diferentes valores alargan o comprimen 
la gráfica en la dirección x. 

Si se integra para obtener E(X) y P(X 2 ) se tiene 


^ - /3T 1 + 


1 






El cálculo de ¡jl y cr 2 requiere por lo tanto el uso de la función gama. 

La integración fgf(v; a , j8) dy es fácil de realizar para obtener la función de distribu¬ 
ción acumulativa de X. 


La función de distribución acumulativa de una variable aleatoria de Weibull con pa¬ 
rámetros a y ¡3 es 


E(x; a, ¡3) 


0 x < 0 

— x > o 


(4.12) 


En años recientes la distribución Weibull ha sido utilizada para modelar emisiones de va¬ 
rios contaminantes de motores. Sea X la cantidad de emisiones de NO t (g/gal) de un mo¬ 
tor de cuatro tiempos de un tipo seleccionado al azar y suponga que X tiene una 
distribución Weibull con a = 2 y ¡3 = 10 (sugeridos por la información que aparece en el 
artículo “Quantification of Variability and Uncertainty in Lawn and Garden Equipment 
NO v and Total Hydrocarbon Emission Factors”, J. of the Air and Waste Management As- 
soc., 2002: 435-448). La curva de densidad correspondiente se ve exactamente como la de 
la figura 4.28 con a = 2, ¡3 = 1 excepto que ahora los valores 50 y 100 reemplazan a 5 y 
10 en el eje horizontal (debido a que f3 es un “parámetro de escala”). Entonces 

P(X < 10) = E(10; 2, 10) = 1 - e - (10/10 > 2 = 1 - e- ¡ = 0.632 

Asimismo, P(X < 25) = 0.998, así que la distribución está concentrada casi por completo 
en valores entre 0 y 25. El valor c, el cual separa 5% de todos los motores que emiten las 
más grandes cantidades de NO x del 95% restante, satisface 

0.95 = 1 - e~ (c/w)2 


Aislando el término exponencial en un lado, tomando logaritmos y resolviendo la ecuación 
resultante se obtiene c ~ 17.3 como el 95° percentil de la distribución de emisiones. ■ 
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Ejemplo 4.26 
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En situaciones prácticas, un modelo de Weibull puede ser razonable excepto que el 
valor de X más pequeño posible puede ser algún valor y que no se supone sea cero (esto 
también se aplicaría a un modelo gama). La cantidad y puede entonces ser considerada co¬ 
mo un tercer parámetro de la distribución, lo cual es lo que Weibull hizo en su trabajo ori¬ 
ginal. Con, por ejemplo, y = 3, todas las curvas que aparecen en la figura 4.28 se 
desplazarían 3 unidades a la derecha. Esto equivale a decir que X — y tiene la función de 
densidad de probabilidad (4.11) de modo que la función de distribución acumulativa de X 
se obtiene reemplazando x en (4.12) por x — y. 






Figura 4.28 Curvas de densidad Weibull. 


Sea X = la pérdida de peso por corrosión de una pequeña placa de aleación de magnesio 
cuadrada sumergida durante 7 días en una solución inhibida acuosa al 20% de MgBr,. Su¬ 
ponga que la pérdida de peso mínima posible es y = 3 y que el exceso X — 3 sobre esta 
mínima tiene una distribución Weibull con a = 2 y /3 = 4. (Este ejemplo se consideró en 
“Practical Applications of the Weibull Distribution”, Industrial Quality Control, agosto de 
1964: 71-78; los valores de a y ¡3 se consideraron como 1.8 y 3.67, respectivamente, aun 
cuando en el artículo se utilizó una selección de parámetros un poco diferente.) La función 
de distribución acumulativa de X es entonces 

F(x; a, f3, y) = F{ X -, 2, 4, 3) ={ J _ _ 3)/4f 
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Por consiguiente, 

P(X > 3.5) = 1 - F( 3.5; 2, 4, 3) = e -°- 0156 = 0.985 


y 


P(7 < X < 9) = 1 - e~ 2 - 25 - (1 - e~ l ) 


= 0.895 - 0.632 = 0.263 ■ 


Distribución lognormal 


DEFINICIÓN 


Se dice que una variable aleatoria no negativa X tiene una distribución lognormal si 
la variable aleatoria Y = \n(X) tiene una distribución normal. La función de densidad 
de probabilidad resultante de una variable aleatoria lognormal cuando el ln(X) está 
normalmente distribuido con parámetros ¡x y cr es 

I —— - e -[ln(.x)-iif/(2cr 2 ) r > O 

/(x; [x, cr) =\ V27 t crx 

[ 0 x < 0 


Hay que tener cuidado aquí; los parámetros /r y cr no son la media y la desviación estándar 
de X sino de ln(Z). Se puede demostrar que la media y varianza de X son 

E(X) = e^ 1 ' 2 V(X) = e 2 ^ 1 • (e* 2 - 1) 

En el capítulo 5, se presenta una justificación teórica para esta distribución en cone¬ 
xión con el Teorema del Límite Central, pero como con cualesquiera otras distribuciones, se 
puede utilizar la lognormal como modelo incluso en la ausencia de semejante justificación. 
La figura 4.29 ilustra gráficas de la función de densidad de probabilidad lognormal; aunque 
una curva normal es simétrica, una curva lognormal tiene una asimetría positiva. 

Como el \n(X) tiene una distribución normal, la función de distribución acumulativa 
de X puede ser expresada en términos de la función de distribución acumulativa <b(,~) de una 
variable aleatoria normal estándar Z. 


F{x\ ¡x, cr) = P(X < x) = P[\n(X) < ln(x)] 



Z< 


ln(x) — ¡jl 


= <W ln(x ) - p 


x > 0 


(4.13) 


fix) 



Figura 4.29 Curvas de densidad lognormal. 
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Ejemplo 4.27 


e 


DEFINICIÓN 
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La distribución lognormal se utiliza con frecuencia como modelo de varias propiedades de 
materiales. El artículo “Reliability of Wood Joist Floor Systems with Creep” (./. ofStructu- 
ral Engr., 1995: 946-954) sugiere que la distribución lognormal con /j, = 0.375 y cr = 0.25 
es un modelo factible de X = el módulo de elasticidad (MDE, en 10 6 lb/pulg 2 ) de sistemas 
de piso de viguetas de madera de pino grado #2. La media y varianza del módulo de elasti¬ 
cidad son 

E(X) = e 0315 + (°- 25 ) 2/2 = e o.40625 _ 1 50 
V(X ) = ^0.8125(^0.0625 - 1) = 0.1453 

La probabilidad de que el módulo de elasticidad esté entre uno y dos es 

P( 1 < X < 2) = P(ln(l) < ln(Z) < ln(2)) 

= P(0 < ln(X) < 0.693) 

0 - 0.375 „ 0.693 - 0.375 

0.25 “ “ 0.25 

= €>(1.27) — €> (-1.50) = 0.8312 



¿Qué valor de c es tal que sólo el 1% de todos los sistemas tienen un módulo de elasticidad 
que excede c? Se desea el valor de c con el cual 


0.99 = P(X 


c) = P Z< 


In(c) ~ 0.375 
0.25 


con la cual (ln(c) — 0.375)/0.25 = 2.33 y c = 2.605. Por lo tanto, 2.605 es el 99° percentil 
de la distribución del módulo de elasticidad. ■ 


Distribución beta 

Todas las familias de distribuciones continuas estudiadas hasta ahora, excepto la distribu¬ 
ción uniforme, tienen densidad positiva a lo largo de un intervalo infinito (aunque por lo ge¬ 
neral la función de densidad se reduce con rapidez a cero más allá de unas cuantas 
desviaciones estándar de la media). La distribución beta proporciona densidad positiva sólo 
para X en un intervalo de longitud finita. 



Se dice que una variable aleatoria X tiene una distribución beta con parámetros a , ¡3 
(ambos positivos), A y B si la función de densidad de probabilidad de X es 

Í-J_ . I> + 0 1 ¡x^AY-1 (B^xy-' A 

/(x; a, ¡3, A, B) =\b — A I» ■ T(fi) \B - A ) \B-A) 

0 de lo contrario 

El caso A = 0, B = 1 da la distribución beta estándar. 


La figura 4.30 ilustra varias funciones de densidad de probabilidad beta estándar. Las gráfi¬ 
cas de la función de densidad de probabilidad son similares, excepto que están desplazadas 
y luego alargadas o comprimidas para ajustarse al intervalo [A, B], A menos que a y [3 sean 
enteros, la integración de la función de densidad de probabilidad para calcular probabilida¬ 
des es difícil. Se deberá utilizar una tabla de la función beta incompleta o un programa de 
computadora apropiado. La media y varianza de X son 

a _ 2 _ (B - A) 2 a[3 

~ (a + [3) 2 (a + [3 + 1) 


¡jl = A + (B — A) • 


a + ¡3 
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f(x; a, P) 


5 


4 



a = 2 
P= 0.5 


3 


2 


JC 


0 0.2 0.4 0.6 0.8 


Figura 4.30 Curvas de densidad beta estándar. 


Ejemplo 4.28 Los gerentes de proyectos a menudo utilizan un método llamado PERT (técnica de revisión 


y evaluación de programas) para coordinar las diversas actividades que conforman un gran 
proyecto. (Una aplicación exitosa ocurrió en la construcción de la nave espacial Apolo.) Una 
suposición estándar en el análisis PERT es que el tiempo necesario para completar cualquier 
actividad particular una vez que se ha iniciado tiene una distribución beta con A = el tiem¬ 
po optimista (si todo sale bien) y B = tiempo pesimista (si todo sale mal). Suponga que al 
construir una casa unifamiliar, el tiempo X (en días) necesario para echar los cimientos tie¬ 
ne una distribución beta con vi = 2, B = 5, a = 2 y ¡3 = 3. Entonces, a/(a + j8) = 0.4, así 
que E(X) = 2 + (3)(0.4) = 3.2. Con estos valores de a y /3, la función de densidad de pro¬ 
babilidad de X es una función polinomial simple. La probabilidad de que se requieran a lo 
sumo tres días para echar los cimientos es 




La distribución beta estándar se utiliza comúnmente para modelar la variación en la 
proporción o porcentaje de una cantidad que ocurre en diferentes muestras, tal como la pro¬ 
porción de un día de 24 horas que un individuo está despierto o la proporción de un cierto 
elemento químico en un compuesto. 


EJERCICIOS Sección 4.5 (72-86) 


72. La duración X (en cientos de horas) de un tipo de tubo de 
vacío tiene una distribución de Weibull con parámetros 
a = 2 y ¡3 = 3. Calcule lo siguiente: 


73. Los autores del artículo “A Probabilistic Insulation Life Mo- 
del for Combined Thermal-Electrical Stresses” (IEEE Trans. 
on Elect. Insulation, 1985: 519-522) expresa que “la distri¬ 
bución de Weibull se utiliza mucho en problemas estadísti¬ 
cos relacionados con el envejecimiento de materiales sólidos 
aislantes sometidos a envejecimiento y esfuerzo”. Proponen 
el uso de la distribución como modelo del tiempo (en ho¬ 
ras) hasta la falla de especímenes aislantes sólidos someti¬ 
dos a voltaje de CA. Los valores de los parámetros dependen 
del voltaje y temperatura, suponga a = 2.5 y j8 = 200 (va¬ 
lores sugeridos por datos que aparecen en el artículo). 


a. E(X) y V(X) 

b. P(X < 6) 

c. P(1.5 <X<6) 


(Esta distribución de Weibull se sugiere como modelo de 
tiempo de servicio en “On the Assessment of Equipment 
Reliability: Trading Data Collection Costs for Precisión”, 
J.Engr.Manuf., 1991: 105-109.) 
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a. ¿Cuál es la probabilidad de que la duración de un espé¬ 
cimen sea cuando mucho de 250? ¿De menos de 250? 
¿De más de 300? 

b. ¿Cuál es la probabilidad de que la duración de un espé¬ 
cimen esté entre 100 y 250? 

c. ¿Qué valor es tal que exactamente 50% de todos los es¬ 
pecímenes tengan duraciones que sobrepasen ese valor? 

74. Sea X = el tiempo (en 10“ 1 semanas) desde el envío de un 
producto defectuoso hasta que el cliente lo devuelve. Supon¬ 
ga que el tiempo de devolución mínimo es y = 3.5 y que el 
excedente X — 3.5 sobre el mínimo tiene una distribución de 
Weibull con parámetros a = 2y/?=1.5 (véase el artículo 
Industrial Quality Control , citado en el ejemplo 4.26). 

a. ¿Cuál es la función de distribución acumulativa de XI 

b. ¿Cuáles son el tiempo de devolución esperado y la va- 
rianza del tiempo de devolución? [Sugerencia: Primero 
obtenga E(X - 3.5) y V(X - 3.5).] 

c. Calcule P(X > 5). 

d. Calcule P (5 < X < 8). 

75. Si X tiene una distribución de Weibull con la función de den¬ 
sidad de probabilidad de la expresión (4.11), verifique que 
ix = )3r(l + 1/a). [ Sugerencia: En la integral para E{X) 
cambie la variable y = (x/j8)“, de modo que x = fiy 1,a .] 

76. a. En el ejercicio 72, ¿cuál es la duración mediana de los 

tubos? [ Sugerencia: Use la expresión (4.12).] 

b. En el ejercicio 74, ¿cuál es el tiempo de devolución 
mediano? 

c. Si X tiene una distribución de Weibull con la función de 
distribución acumulativa de la expresión (4.12), obtenga 
una expresión general para el percentil (100;/) 0 de la dis¬ 
tribución. 

d. En el ejercicio 74, la compañía desea negarse a aceptar 
devoluciones después de t semanas. ¿Para qué valor de t 
sólo el 10% de todas las devoluciones serán rechazadas? 

77. Los autores del artículo del cual se extrajeron los datos en 
el ejercicio 1.27 sugirieron que un modelo de probabilidad 
razonable de la duración de las brocas era una distribución 
lognormal con [x = 4.5 y cr = 0.8. 

a. ¿Cuáles son el valor medio y la desviación estándar de 
la duración? 

b. ¿Cuál es la probabilidad de que la duración sea cuando 
mucho de 100? 

c. ¿Cuál es la probabilidad de que la duración sea por lo 
menos de 200? ¿De más de 200? 

78. El artículo “On Assessing the Accuracy of Offshore Wind 
Turbine Reliability-Based Design Loads from the Environ- 
mental Contour Method” (Intl. J. of Offshore and Polar 
Engr., 2005: 132-140) propone la distribución de Weibull 
con a = 1.817 y /3 = 0.863 como modelo de una altura (m) 
de olas significativa durante una hora en un sitio. 

a. ¿Cuál es la probabilidad de que la altura de las olas sea 
cuando mucho de 0.5 m? 

b. ¿Cuál es la probabilidad de que la altura de las olas ex¬ 
ceda su valor medio por más de una desviación estándar? 

c. ¿Cuál es la mediana de la distribución de la altura de las 
olas? 

d. Para 0 < p < 1, dé una expresión general para el percen¬ 
til (100p) e de la distribución de altura de olas. 

79. Sea X = la potencia mediana por hora (en decibeles) de se¬ 
ñales de radio transmitidas entre dos ciudades. Los autores 
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del artículo “Families of Distributions for Hourly Median 
Power and Instantaneous Power of Received Radio Sig¬ 
náis” ( J. Research National Burean of Standards, vol. 67D, 
1963: 753-762) argumentan que la distribución lognormal 
proporciona un modelo de probabilidad razonable para X. 
Si los valores de parámetros son ¿i = 3.5 y cr = 1.2, calcu¬ 
le lo siguiente: 

a. El valor medio y la desviación estándar de la potencia 
recibida. 

b. La probabilidad de que la potencia recibida esté entre 50 
y 250 dB. 

c. La probabilidad de que X sea menor que su valor medio. 
¿Por qué esta probabilidad no es de 0.5? 

80. a. Use la ecuación (4.13) para escribir una fórmula para la 

mediana jü de la distribución lognormal. ¿Cuál es la me¬ 
diana de la distribución de potencia del ejercicio 79? 
b. Recordando que z a es la notación para el percentil 
100(1 — cr) de la distribución normal estándar, escriba 
una expresión para el percentil 100(1 — a) de la distri¬ 
bución lognormal. En el ejercicio 79, ¿qué valor exce¬ 
derá la potencia recibida sólo 5% del tiempo? 

81. Una justificación teórica basada en el mecanismo de falla 
de cierto material sustenta la suposición de que la resisten¬ 
cia dúctil X de un material tiene una distribución lognormal. 
Suponga que los parámetros son ¿i = 5ycr = 0.1. 

a. Calcule E(X) y V(X). 

b. Calcule P(X > 125). 

c. Calcule P(l 10 <X< 125). 

d. ¿Cuál es el valor de la resistencia dúctil mediana? 

e. Si diez muestras diferentes de un acero de aleación de es¬ 
te tipo se sometieran a una prueba de resistencia, ¿cuántas 
esperaría que tengan una resistencia de por lo menos 125? 

f. Si 5% de los valores de resistencia más pequeños fueran 
inaceptables, ¿cuál sería la resistencia mínima aceptable? 

82. El artículo “The Statistics of Phytotoxic Air Pollutants” (J. 
Royal Stat. Soc., 1989:183-198) sugiere la distribución 
lognormal como modelo de la concentración de SO, sobre 
un cierto bosque. Suponga que los valores de parámetro 
son ix = 1.9 y cr = 0.9. 

a. ¿Cuáles son el valor medio y la desviación estándar de 
la concentración? 

b. ¿Cuál es la probabilidad de que la concentración sea 
cuando mucho de 10? ¿De entre 5 y 10? 

83. ¿Qué condición en relación con a y j8 es necesaria para que 
la función de densidad de probabilidad beta estándar sea si¬ 
métrica? 

84. Suponga que la proporción X de área en un cuadrado selec¬ 
cionado al azar que está cubierto por cierta planta tiene una 
distribución beta estándar con a = 5 y /3 = 2. 

a. Calcule E(X) y V(X). 

b. Calcule P(X < 0.2). 

c. Calcule P(0.2 < V < 0.4). 

d. ¿Cuál es la proporción esperada de la región de mues- 
treo no cubierta por la planta? 

85. Si X tiene una densidad beta estándar con parámetros ay/3. 

a. Verifique la fórmula para E{X) dada en la sección. 

b. Calcule £[(1 — X)'"]. Si X representa la proporción de 
una sustancia compuesta de un ingrediente particular, 
¿cuál es la proporción esperada que no se compone de 
ese ingrediente? 
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86 . Se aplica esfuerzo a un barra de acero de 20 pulg sujeta por a. 

cada extremo en una posición fija. Sea Y — la distancia del 
extremo izquierdo al punto donde se rompe la barra. Su- b. 

ponga que Í720 tiene una distribución beta estándar con c. 

E(Y) = 10 y V{Y) = 


i oo 
7 


¿Cuáles son los parámetros de la distribución beta están¬ 
dar de interés? 

Calcule P (8 < Y < 12). 

Calcule la probabilidad de que la barra se rompa a más 
de 2 pulg de donde esperaba que se rompiera. 


4.6 Gráficas de probabilidad 


Un investigador a menudo ha obtenido una muestra numérica x¡, x 2 , x n y desea saber 
si es factible que provenga de una distribución de población de un tipo particular (p. ej., 
de una distribución normal). Entre otras cosas, muchos procedimientos formales de inferen¬ 
cia estadística están basados en la suposición de que la distribución de población es de un tipo 
específico. El uso de un procedimiento como esos es inapropiado si la distribución de pro¬ 
babilidad subyacente existente difiere en gran medida del tipo supuesto. Además, el enten¬ 
dimiento de la distribución subyacente en ocasiones puede dar una idea de los mecanismos 
físicos implicados en la generación de los datos. Una forma efectiva de verificar una suposi¬ 
ción distribucional es construir una gráfica de probabilidad. La esencia de una gráfica como 
ésa es que si la distribución en la cual está basada es correcta, los puntos en la gráfica queda¬ 
rán casi en una línea recta. Si la distribución real es bastante diferente de la utilizada para cons¬ 
truir la curva, los puntos deberán apartarse sustancialmente de un patrón lineal. 




Percentiles muéstrales 

Los detalles implicados al construir gráficas de probabilidad difieren un poco de una fuen¬ 
te a otra. La base de la construcción es una comparación entre percentiles de los datos mués¬ 
trales y los percentiles correspondientes de la distribución considerada. Recuérdese que el 
percentil (100/?)° de una distribución continua con función de distribución acumulativa /-’(•) 
es el número rj(p) que satisface F(r¡(p)) = p. Es decir, r\(p) es el número sobre la escala de 
medición de modo que el área bajo la curva de densidad a la izquierda de 77 ( 77 ) es p. Por lo 
tanto el percentil 50° tj( 0.5) satisface f Y 17 (0.5)) = 0.5 y el percentil 90° satisface F( tj( 0.9)) 
= 0.9. Considere como ejemplo la distribución normal estándar, para la cual la función de 
distribución acumulativa es <[>(•). En la tabla A.3 del apéndice, el 20° percentil se halla lo¬ 
calizando la fila y columna en la cual aparece 0.2000 (o un número tan cerca de él como es 
posible) en el interior de la tabla. Como 0.2005 aparece en la intersección de la fila —0.8 y la 
columna 0.04, el 20° percentil es aproximadamente —0.84. Asimismo el 25° percentil de 
la distribución normal estándar es (utilizando interpolación lineal) aproximadamente —0.675. 

En general, los percentiles muéstrales se definen del mismo modo que se definen los 
percentiles de una distribución de población. El 50° percentil muestral deberá separarse del 
50% más pequeño de la muestra del 50% más grande, el 90° percentil deberá ser tal que el 
90% de la muestra quede debajo de ese valor y el 10% quede sobre ese valor, y así de ma¬ 
nera sucesiva. Desafortunadamente, se presentan problemas cuando en realidad se trata de 
calcular los percentiles muéstrales de una muestra particular de n observaciones. Si, por 
ejemplo, n = 10, se puede separar 20% de estos valores o 30% de los datos, pero no hay 
ningún valor que separe con exactitud 23% de estas diez observaciones. Para ir más allá, se 
requiere una definición operacional de percentiles muéstrales (este es un lugar donde dife¬ 
rentes personas hacen cosas un poco diferentes). Recuérdese que cuando n es impar, la me¬ 
diana muestral o el 50° percentil muestral es el valor medio en la lista ordenada, por 
ejemplo, el sexto valor más grande cuando n = 11. Esto equivale a considerar la observa¬ 
ción media como la mitad en la mitad inferior de los datos y la mitad en la mitad superior. 
Asimismo, supóngase que n = 10. Entonces, si a este tercer valor más pequeño se le da el 
nombre de 25° percentil, ese valor se está considerando como la mitad en el grupo inferior 
(compuesto de las dos observaciones más pequeñas) y la mitad en el grupo superior (las siete 
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observaciones más grandes). Esto conduce a la siguiente definición general de percentiles 
muéstrales. 


Se ordenan las n observaciones muéstrales de la más pequeña a la más grande. Enton¬ 
ces la observación i-ésima más pequeña en la lista se considera que es el [100(7 — 
0.5)/n] e percentil muestral. 


Una vez que se han calculado los valores porcentuales 100(7 — 0.5 )ln(i = 1,2, , 

n), se pueden obtener los percentiles muéstrales correspondientes a porcentajes intermedios 
mediante interpolación lineal. Por ejemplo, si n = 10, los porcentajes correspondientes a las 
observaciones muéstrales ordenadas son 100(1 — 0.5)/10 = 5%, 100(2 — 0.5)/10 = 15%, 
25%, . . . , y 100(10 — 0.5)/10 = 95%. El 10° percentil está entonces a la mitad entre el 
5 o percentil (observación muestral más pequeña) y el 15° (segunda observación más pe¬ 
queña). Para los propósitos, en este caso, tal interpolación no es necesaria porque una grá¬ 
fica de probabilidad se basa sólo en los porcentajes 100(7 — 0.5)/n correspondientes a las n 
observaciones muéstrales. 

Gráfica de probabilidad 

Supóngase ahora que para los porcentajes 100(7 — 0.5)/n(¿ = 1, . . . , rí) se determinan los 
percentiles de una distribución de población especificada cuya factibilidad está siendo in¬ 
vestigada. Si la muestra en realidad se seleccionó de la distribución especificada, los per¬ 
centiles muéstrales (observaciones muéstrales ordenadas) deberán estar razonablemente 
próximos a los percentiles de distribución de población correspondientes. Es decir, con i = 
1, 2, . . ., n deberá haber una razonable concordancia entre la i-ésima observación muestral 
más pequeña y el [100(7 — 0.5)/n]° percentil de la distribución especificada. Considérense 
los (percentil poblacional, percentil muestral) pares, es decir, los pares 

/ [100(7 - 0.5)/n]° percentil i-ésima observación \ 

^ de la distribución ’ muestral más pequeña J 

con i = 1Cada uno de esos pares se dibuja como un punto en un sistema de coor¬ 
denadas bidimensional. Si los percentiles muéstrales se acercan a los percentiles de distri¬ 
bución de población correspondientes, el primer número en cada par será aproximadamente 
igual al segundo número. Los puntos dibujados se quedarán entonces cerca de una línea a 
45°. Desviaciones sustanciales de los puntos dibujados con respecto a una línea a 45° hacen 
dudar de la suposición de que la distribución considerada es la correcta. 

Un experimentador conoce el valor de cierta constante física. El experimentador realiza n = 10 
mediciones independientes de este valor por medio de un dispositivo de medición particu¬ 
lar y anota los errores de medición resultantes (error = valor observado — valor verdade¬ 
ro). Estas observaciones aparecen en la tabla adjunta. 



Porcentaje 

5 

15 

25 

35 

45 

Percentil z 

-1.645 

-1.037 

-0.675 

-0.385 

-0.126 

Observación muestral 

-1.91 

-1.25 

-0.75 

-0.53 

0.20 

Porcentaje 

55 

65 

75 

85 

95 

Percentil z 

0.126 

0.385 

0.675 

1.037 

1.645 

Observación muestral 

0.35 

0.72 

0.87 

1.40 

1.56 
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¿Es factible que el error de medición de una variable aleatoria tenga una distribución nor¬ 
mal estándar? Los percentiles (z) normales estándares requeridos también se muestran en la 
tabla. Por lo tanto, los puntos en la gráfica de probabilidad son (—1.645, —1.91), (—1.037, 
— 1.25),. . ., y (1.645, 1.56). La figura 4.31 muestra la gráfica resultante. Aunque los puntos 
se desvían un poco de la línea a 45°, la impresión predominante es que la línea se adapta a 
los puntos muy bien. La gráfica sugiere que la distribución normal estándar es un modelo 
de probabilidad razonable de error de medición. 



Valor 

observado 



Figura 4.31 Gráficas de pares (percentil z, valor observado) con los datos del ejemplo 4.29: 
primera muestra. 

La figura 4.32 muestra una gráfica de pares (percentil observación) de una segunda 
muestra de diez observaciones. La línea a 45° da una buena adaptación a la parte media de 
la muestra pero no a los extremos. La gráfica tiene apariencia S bien definida. Las dos ob¬ 
servaciones muéstrales más pequeñas son considerablemente más grandes que los percenti¬ 
les z correspondientes 




Figura 4.32 Gráficas de pares (percentil z, valor observado) con los datos del ejemplo 4.29: 
segunda muestra. 
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(los puntos a la extrema izquierda de la gráfica están bien por arriba de la línea a 45°). Asimis¬ 
mo, las dos observaciones muéstrales más grandes son mucho más pequeñas que los percen- 
tiles z asociados. Esta gráfica indica que la distribución normal estándar no sería una opción 
factible del modelo de probabilidad que dio lugar a estos errores de medición observados. ■ 

A un investigador en general no le interesa saber con exactitud si una distribución de 
probabilidad especificada, tal como la distribución normal estándar (normal con ¡l = 0 y 
cr = 1) o la distribución exponencial con A = 0.1, es un modelo factible de la distribución de 
población de la cual se seleccionó la muestra. En cambio, la cuestión es si algún miembro 
de una familia de distribuciones de probabilidad especifica un modelo factible, la familia de 
distribuciones normales, la familia de distribuciones exponenciales, la familia de distribu¬ 
ciones Weibull, y así sucesivamente. Los valores de los parámetros de una distribución casi 
nunca se especifican al principio. Si la familia de distribuciones Weibull se considera como 
modelo de datos de duración, ¿existen algunos valores de los parámetros ay ¡3 con los cuales 
la distribución de Weibull correspondiente se adapta bien a los datos? Afortunadamente, casi 
siempre es el caso de que sólo una gráfica de probabilidad bastará para evaluar la factibilidad 
de una familia completa. Si la gráfica se desvía sustancialmente de una línea recta, ningún 
miembro de la familia es factible. Cuando la gráfica es bastante recta, se requiere más tra¬ 
bajo para estimar valores de los parámetros que generen la distribución más razonable del 
tipo especificado. 

Habrá que enfocarse en una gráfica para verificar la normalidad. Tal gráfica es útil en 
trabajo aplicado porque muchos procedimientos estadísticos formales dan inferencias pre¬ 
cisas sólo cuando la distribución de población es por lo menos aproximadamente normal. 
Estos procedimientos en general no deben ser utilizados si la gráfica de probabilidad nor¬ 
mal muestra un alejamiento muy pronunciado de la linealidad. La clave para construir una 
gráfica de probabilidad normal que comprenda varios elementos es la relación entre los per- 
centiles (z.) normales estándares y aquellos de cualquier otra distribución normal: 

percentil de una 

.. . . . = u + cr • ( percentil z correspondiente) 

distribución normal (¡l, cr) ^ ' 1 

Considérese primero el caso, ¡jl = 0. Si cada observación es exactamente igual al percentil 
normal correspondiente con algún valor de cr, los pares (cr • [percentil z], observación) que¬ 
dan sobre una línea a 45°, cuya pendientes es 1. Esto implica que los pares (percentil z, ob¬ 
servación) quedan sobre una línea que pasa por (0, 0) (es decir, una con intercepción y 
en 0) pero con pendiente cr en lugar de 1 . El efecto del valor no cero de ¡jl es simplemente 
cambiar la intercepción y de 0 a ¡jl. 



Una gráfica de los n pares 

([ 100(/ — 0.5)/n]° percentil z„ observación í-ésima más pequeña) 

en un sistema de coordenadas bidimensional se llama gráfica de probabilidad nor¬ 
mal. Si las observaciones muéstrales se extraen en realidad de una distribución 
normal con valor medio ¿i y desviación estándar cr, los puntos deberán quedar cerca 
de una línea recta con pendiente cr e intercepción en ¡jl. Así pues, una gráfica en la 
cual los puntos quedan cerca de alguna línea recta sugiere que la suposición de una 
distribución de población normal es factible. 


La muestra adjunta compuesta de n = 20 observaciones de voltaje de ruptura dieléctrica 
de un pedazo de resina epóxica apareció en el artículo “Máximum Likelihood Estimation 
in the 3-Parameter Weibull Distribution” (IEEE Trans. on Dielectrics and Elec. Insul., 
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1996: 43-55). Los valores de (i — 0.5 )/n para los cuales se requieren los percentiles z son 
(1 - 0.5)/20 = 0.025, (2 - 0.5)/20 = 0.075, . . . , y 0.975. 


Observación 

24.46 

25.61 

26.25 

26.42 

26.66 

27.15 

27.31 

27.54 

27.74 

27.94 

Percentil z 

-1.96 

-1.44 

-1.15 

-0.93 

-0.76 

-0.60 

-0.45 

-0.32 

-0.19 

-0.06 

Observación 

27.98 

28.04 

28.28 

28.49 

28.50 

28.87 

29.11 

29.13 

29.50 

30.88 

Percentil z 

0.06 

0.19 

0.32 

0.45 

0.60 

0.76 

0.93 

1.15 

1.44 

1.96 


La figura 4.33 muestra la gráfica de probabilidad normal resultante. La configuración en la 
gráfica es bastante recta, lo que indica que es factible que la distribución de la población de 
voltaje de ruptura dieléctrica es normal. 



Voltaje 



Figura 4.33 Gráfica de probabilidad normal de la muestra de voltaje de ruptura dieléctrica. 



Existe una versión alternativa de una curva de probabilidad normal en la cual el eje de 
los percentiles z es reemplazado por un eje de probabilidad no lineal. La graduación a escala 
de este eje se construye de modo que los puntos graficados de nuevo queden cerca de una lí¬ 
nea cuando la distribución muestreada es normal. La figura 4.34 muestra una gráfica como esa 
generada por MINITAB con los datos de voltaje de ruptura del ejemplo 4.30. 



Figura 4.34 Gráfica de probabilidad normal de los datos de voltaje de ruptura generada 
por MINITAB. 
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Una distribución de población no normal a menudo puede ser colocada en una de las 
siguientes tres categorías: 

1. Es simétrica y tiene “colas más livianas” que una distribución normal; es decir la curva 
de densidad declina con más rapidez en la cola de lo que lo hace una curva normal. 

2. Es simétrica y con colas pesadas en comparación con una distribución normal. 

3. Es asimétrica. 

Una distribución uniforme es de cola liviana, puesto que su función de densidad se reduce a 
cero afuera de un intervalo finito. La función de densidad fix) = l/[7r(l + ;r)] en — °° < x < 00 
es de cola pesada, puesto que 1/(1 + x 2 ) declina mucho menos rápidamente que e A ' 2/2 . Las dis¬ 
tribuciones lognormal y Weibull se encuentran entre aquellas que son asimétricas. Cuando 
los puntos en una gráfica de probabilidad normal no se adhieren a una línea recta, la confi¬ 
guración con frecuencia sugerirá que la distribución de la población se encuentra en una ca¬ 
tegoría particular de estas tres categorías. 

Cuando la distribución de la cual se selecciona la muestra es de cola liviana, las ob¬ 
servaciones más grandes y más pequeñas en general no son tan extremas como podría espe¬ 
rarse de una muestra aleatoria normal. Visualícese una línea recta trazada a través de la parte 
media de la gráfica; los puntos a la extrema derecha tienden a estar debajo de la línea (va¬ 
lor observado < el percentil ¿) en tanto que los puntos a la extrema izquierda de la gráfica 
tienden a quedar sobre la línea recta (valor observado > percentil z). El resultado es una 
configuración en forma de S del tipo ilustrado en la figura 4.32. 

Una muestra tomada de una distribución de cola pesada también tiende a producir una 
gráfica en forma de S. Sin embargo, en contraste con el caso de cola liviana, el extremo iz¬ 
quierdo de la gráfica se curva hacia abajo (observado < percentil z), como se muestra en la 
figura 4.35a). Si la distribución subyacente es positivamente asimétrica (una cola izquierda 
corta y una cola derecha larga), las observaciones muéstrales más pequeñas serán más gran¬ 
des que las esperadas con una muestra normal y también lo serán las observaciones más 
grandes. En este caso, los puntos en ambos extremos de la gráfica quedarán sobre una línea 
recta que pasa por la parte media, que produce una configuración curvada, como se ilustra 
en la figura 4.35b). Una muestra tomada de una distribución lognormal casi siempre produ¬ 
cirá la configuración mencionada. Una gráfica de (percentil z, Iníx)) pares deberán parecer¬ 
se entonces a una línea recta. 


Observación 


Observación 


- Percentil z 


a) 


b) 


••• 


Percentil z 


Figura 4.35 Gráficas de probabilidad que sugieren una distribución no normal: a) una gráfica compatible con 
una distribución de cola pesada; b) una gráfica compatible con una distribución positivamente asimétrica. 
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Aun cuando la distribución de la población sea normal, los percentiles muéstrales no 
coincidirán exactamente con los teóricos debido a la variabilidad del muestreo. ¿Qué tanto 
pueden desviarse los puntos de la gráfica de probabilidad de un patrón de línea recta antes 
de que la suposición de normalidad ya no sea factible? Esta no es una pregunta fácil de res¬ 
ponder. En general, es más probable que una pequeña muestra de una distribución normal 
produzca una gráfica con un patrón no lineal que una grande. El libro Fitting Equcitions to 
Data (véase la bibliografía del capítulo 13) presenta los resultados de un estudio de simulación 
en el cual se seleccionaron numerosas muestras de diferentes tamaños de distribuciones nor¬ 
males. Los autores concluyeron que en general varía mucho la apariencia de la gráfica de 
probabilidad con tamaños de muestra de menos de 30 y sólo con tamaños de muestra mu¬ 
cho más grandes en general predomina el patrón lineal. Cuando una gráfica está basada en 
un pequeño tamaño de muestra, sólo un alejamiento muy sustancial de la linealidad se de¬ 
berá considerar como evidencia concluyente de no normalidad. Un comentario similar se 
aplica a gráficas de probabilidad para comprobar la factibilidad de otros tipos de distribu¬ 
ciones. 

Más allá de la normalidad 

Considérese una familia de distribuciones de probabilidad que implica dos parámetros 0 X y 
0 2 y sea F(x; 0¡, 0 2 ) la función de distribución acumulativa correspondiente. La familia de dis¬ 
tribuciones normales es una de esas familias, con 0 X = ¡j,, 0 2 = cr y F(x; ¡i, cr) = d>[(r — /x)/<r]. 
Otro ejemplo es la familia Weibull, con 0 X = a, 0 2 = ¡3 y 

F(x- a, ¡3) = l — e~W>‘ 

Otra familia más de este tipo es la familia gama, para la cual la función de distribución 
acumulativa es una integral que implica la función gama incompleta que no puede ser ex¬ 
presada en cualquier forma más simple. 

Se dice que los parámetros //, y 0 2 son parámetros de ubicación y escala, respecti¬ 
vamente, si F(x; 0 V 0 2 ) es una función de (x — 0 X )I0 2 . Los parámetros y cr de la familia 
normal son los parámetros de ubicación y escala, respectivamente. Al cambiar ¡i la curva de 
densidad acampanada se desplaza a la derecha o izquierda y al cambiar cr se alarga o com¬ 
prime la escala de medición (la escala sobre el eje horizontal cuando se dibuja la función de 
densidad). La función de distribución acumulativa da otro ejemplo 

F(x\ di, 0 2 ) = 1 — e-' ( ' J i v8 2 -oo < x < °° 

Se dice que una variable aleatoria con esta función de distribución acumulativa tiene una 
distribución de valor extremo. Se utiliza en aplicaciones que implican la duración de un 
componente y la resistencia de un material. 

Aunque la forma de la función de distribución acumulativa de valor extremo a prime¬ 
ra vista pudiera sugerir que 0 X es el punto de simetría de la función de densidad y por ende 
la media y la mediana, éste no es el caso. En cambio, P(X < 0¡) = F{Q X , 6 2 ) = 1 — e~ l = 
0.632, y la función de densidad/(x; 0¡, 0 2 ) = F'(x; 0¡, 0 2 ) es negativamente asimétrica (una 
larga cola inferior). Asimismo, el parámetro de escala 0 2 no es la desviación estándar (p, = 
0 X — 0.51120, y cr = 1.283 1 ? 2 ). Sin embargo, al cambiar el valor de 0¡ cambia la ubicación 
de la curva de densidad, mientras que al cambiar 0 2 cambia la escala del eje de medición. 

El parámetro ¡3 de la distribución de Weibull es un parámetro de escala, pero a no es un 
parámetro de ubicación. El parámetro a en general se conoce como parámetro de forma. 
Un comentario similar es pertinente para los parámetros a y ¡3 de la distribución gama. En 
la forma usual, la función de densidad de cualquier miembro de o la distribución gama o Wei¬ 
bull es positiva con x > 0 y cero de lo contrario. Un parámetro de ubicación puede ser in¬ 
troducido como tercer parámetro y (se hizo esto para la distribución de Weibull) para 
desplazar la función de densidad de modo que sea positiva si x > y y cero de lo contrario. 
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Cuando la familia considerada tiene sólo parámetros de ubicación y escala, el tema de 
si cualquier miembro de la familia es una distribución de población factible puede ser abor¬ 
dado vía una gráfica de probabilidad única de fácil construcción. Primero se obtienen los 
percentiles de la distribución estándar , una con 6 X = 0 y 0 2 = 1, con los porcentajes 
100 (i — 0.5 )/n (i = 1, . . . , n). Los n pares (percentil estandarizado, observación) dan los 
puntos en la gráfica. Esto es exactamente lo que se hizo para obtener una gráfica de proba¬ 
bilidad normal ómnibus. Un tanto sorprendentemente, esta metodología puede ser aplicada 
para dar una gráfica de probabilidad Weibull ómnibus. El resultado clave es que X tiene una 
distribución de Weibull con parámetro de forma a y parámetro de escala ¡3, entonces la va¬ 
riable transformada ln(X) tiene una distribución de valor extremo con parámetro de ubica¬ 
ción 0 X = ln(j3) y parámetro de escala 1/a. Así pues una gráfica de los pares (percentil 
estandarizado de valor extremo, ln(x)) que muestre un fuerte patrón lineal apoya la selec¬ 
ción de la distribución de Weibull como modelo de una población. 

Las observaciones adjuntas son de la duración (en horas) del aislamiento de aparatos eléc¬ 
tricos cuando la aceleración del esfuerzo térmico y eléctrico se mantuvo fijo a valores par¬ 
ticulares (“On the Estimation of Life of Power Apparatus Insulation Under Combined 
Electrical and Thermal Stress”, IEEE Trans. on Eléctrical Insulation, 1985: 70-78). Una 
gráfica de probabilidad de Weibull necesita calcular primero los percentiles 5 o , 15°, . . . , y 
95° de la distribución de valor extremo estándar. El (100/;)- percentil r¡(p) satisface 

P = F(r¡(p)) = 1 - e-^ p) 
de donde r¡(p) = ln[—ln(l — p)]. 


Percentil -2.97 -1.82 -1.25 -0.84 -0.51 


X 

282 

501 

741 

851 

1072 

ln(x) 

5.64 

6.22 

6.61 

6.75 

6.98 

Percentil 

-0.23 

0.05 

0.33 

0.64 

1.10 

X 

1122 

1202 

1585 

1905 

2138 

ln(x) 

7.02 

7.09 

7.37 

7.55 

7.67 


Los pares (—2.97, 5.64), (—1.82, 6.22), . . . , (1.10, 7.67) se dibujan como puntos en la fi¬ 
gura 4.36. La forma recta de la gráfica hacia la derecha argumenta firmemente a favor del 
uso de la distribución de Weibull como modelo de duración de aislamiento, una conclusión 
también alcanzada por el autor del citado artículo. 


lnW 
8 - 


7 - 


6 - 


,Á I I I I I I I| 


-3 -2 


-1 


Percentil 


Figura 4.36 Gráfica de probabilidad Weibull de los datos de duración del aislamiento. 
























c4_pl30-183.qxd 3/12/08 4:05 AM Page 178 



178 CAPÍTULO 4 Variables aleatorias continuas y distribuciones de probabilidad 

La distribución gama es un ejemplo de una familia que implica un parámetro de for¬ 
ma para el cual no hay ninguna transformación /?(•) de tal suerte que h(X) tenga una distri¬ 
bución que dependa sólo de los parámetros de ubicación y escala. Para construir una gráfica 
de probabilidad primero se tiene que estimar el parámetro de forma de los datos muéstrales 
(algunos métodos para realizar lo anterior se describen en el capítulo 6). En ocasiones un 
investigador desea saber si la variable transformada X 6 tiene una distribución normal con al¬ 
gún valor de 6 (por convención, 9 = 0 es idéntica a la transformación, en cuyo caso X tie¬ 
ne una distribución lognormal). El libro Graphical Methods for Data Analysis, citado en la 
bibliografía del capítulo 1, discute este tipo de problema así como también otros refinamien¬ 
tos de construcción de gráficas de probabilidad. Afortunadamente, la amplia disponibilidad 
de varias gráficas de probabilidad junto con paquetes de software estadísticos significa que 
el usuario con frecuencia puede evitar los detalles técnicos. 


EJERCICIOS Sección 4.6 (87-97) 


87 . La gráfica de probabilidad normal adjunta se construyó con 
una muestra de 30 lecturas de tensión de pantallas de malla 
localizadas detrás de la superficie de tubos de visualización 
de video utilizadas en monitores de computadora. ¿Parece 
factible que la distribución de tensión sea normal? 


Tensión 



88 . Considere las siguientes diez observaciones de duración de 
cojinetes (en horas): 

152.7 172.0 172.5 173.3 193.0 

204.7 216.5 234.9 262.6 422.6 

Construya una gráfica de probabilidad normal y comente 
sobre la factibilidad de la distribución normal como mode¬ 
lo de la duración de cojinetes (datos de “Modified Moment 
Estimation for the Three-Parameter Lognormal Distribu- 
tion”, J. Quality Technology, 1985: 92-99). 

89 . Construya una gráfica de probabilidad normal con la siguien¬ 
te muestra de observaciones de espesor de recubrimiento de 
pintura de baja viscosidad (“Achieving a Target Valué for a 
Manufacturing Process: A Case Study”, J. of Quality Tech¬ 
nology, 1992: 22-26). ¿Se sentiría cómodo estimando el es¬ 
pesor medio de la población con un método que supuso una 
distribución de población normal? 

0.83 0.88 0.88 1.04 1.09 1.12 1.29 1.31 

1.48 1.49 1.59 1.62 1.65 1.71 1.76 1.83 


90 . El artículo “A Probabilistic Model of Fracture in Concrete 
and Size Effects on Fracture Toughness” ( Magazine of Con¬ 
crete Res., 1996: 311-320) da argumentos de por qué la dis¬ 
tribución de tenacidad a la fractura en especímenes de 
concreto deben tener una distribución de Weibull y presen¬ 
tar varios histogramas de datos a los que adaptan bien cur¬ 
vas de Weibull superpuestas. Considere la siguiente muestra 
de tamaño n — 18 observaciones de tenacidad de concreto de 
alta resistencia (compatible con uno de los histogramas); 
también se dan los valores dep ; = (i — 0.5)/18. 


Observación 

0.47 

0.58 

0.65 

0.69 

0.72 

0.74 

P¡ 

0.0278 

0.0833 

0.1389 

0.1944 

0.2500 

0.3056 

Observación 

0.77 

0.79 

0.80 

0.81 

0.82 

0.84 

P¡ 

0.3611 

0.4167 

0.4722 

0.5278 

0.5833 

0.6389 

Observación 

0.86 

0.89 

0.91 

0.95 

1.01 

1.04 

P¡ 

0.6944 

0.7500 

0.8056 

0.8611 

0.9167 

0.9722 


Construya una gráfica de probabilidad Weibull y comente 
acerca de ella. 


91 . Construya una gráfica de probabilidad normal con los datos 
de propagación de grietas por fatiga dados en el ejercicio 39 
(capítulo 1). ¿Parece factible que la duración de la propaga¬ 
ción tenga una distribución normal? Explique. 

92 . El artículo “The Load-Life Relationship for M50 Bea- 
rings with Silicon Nitride Ceramic Balls” ( Lubrication 
Engr., 1984: 153-159) reporta los datos adjuntos de dura¬ 
ción de cojinetes (millones de revs.) probados con una 
carga de 6.45 kN. 


47.1 

68.1 

68.1 

90.8 

103.6 

106.0 

115.0 

126.0 

146.6 

229.0 

240.0 

240.0 

278.0 

278.0 

289.0 

289.0 

367.0 

385.9 

392.0 

505.0 



a. Construya una gráfica de probabilidad normal. ¿Es fac¬ 
tible la normalidad? 

b. Construya una gráfica de probabilidad de Weibull. ¿Es 
factible la familia de distribución Weibull? 
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93. Construya una gráfica de probabilidad que le permita evaluar 
la factibilidad de la distribución lognormal como modelo de 
los datos de cantidad de lluvia del ejercicio 83 (capítulo 1). 

94. Las observaciones adjuntas son valores de precipitación du¬ 
rante marzo a lo largo de un periodo de 30 años en Minnea- 
polis-St. Paul. 


0.77 

1.20 

3.00 

1.62 

2.81 

2.48 

1.74 

0.47 

3.09 

1.31 

1.87 

0.96 

0.81 

1.43 

1.51 

0.32 

1.18 

1.89 

1.20 

3.37 

2.10 

0.59 

1.35 

0.90 

1.95 

2.20 

0.52 

0.81 

4.75 

2.05 


a. Construya e interprete una gráfica de probabilidad nor¬ 
mal con este conjunto de datos. 

b. Calcule la raíz cuadrada de cada valor y luego constru¬ 
ya una gráfica de probabilidad normal basada en estos 
datos transformados. ¿Parece factible que la raíz cuadra¬ 
da de la precipitación esté normalmente distribuida? 

c. Repita el inciso b) después de transformar por medio de 
raíces cúbicas. 

95. Use un paquete de software estadístico para construir una grá¬ 
fica de probabilidad normal de los datos de resistencia última 
a la tensión dados en el ejercicio 13 del capítulo 1 y comente. 

96. Sean y v y 2 ,. . ., y n , las observaciones muéstrales ordenadas 
(con V! como la más pequeña y y n como la más grande). Una 
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verificación sugerida de normalidad es dibujar los pares 
(<T> -1 ((í — 0.5)/n), y¡). Suponga que se cree que las observa¬ 
ciones provienen de una distribución con media 0 y sean 
w j, . . . , w n los valores absolutos ordenados de las x¡. Una 
gráfica medio normal es una gráfica de probabilidad de las 
w¡. Más específicamente, como P(|Z| £ w) = P{ — w £ 
Z £ w) = 24>(w) — 1, una gráfica medio normal es una grá¬ 
fica de los pares (<l> '{[(/ — 0.5 )ln + l]/2}, w¡) La virtud 
de esta gráfica es que los valores apartados pequeños o 
grandes en la muestra original ahora aparecerán sólo en el 
extremo superior de la gráfica y no en ambos extremos. 
Construya una gráfica medio normal con la siguiente 
muestra de errores de medición y comente: -3.78, -1.27, 
1.44, -0.39, 12.38, -43.40, 1.15, -3.96, -2.34, 30.84. 

97. Las siguientes observaciones de tiempo de falla (miles de 
horas) se obtuvieron con una prueba de duración acelerada 
de 16 chips de circuitos integrados de un tipo: 


82.8 

11.6 

359.5 

502.5 

307.8 

179.7 

242.0 

26.5 

244.8 

304.3 

379.1 

212.6 

229.9 

558.9 

366.7 

204.6 




Use los percentiles correspondientes de la distribución 
exponencial con A = 1 para construir una gráfica de pro¬ 
babilidad. Luego explique por qué la gráfica valora la facti¬ 
bilidad de la muestra habiendo sido generada con cualquier 
distribución exponencial. 


EJERCICIOS SUPLEMENTARIOS (98-128) 


98. Sea X = el tiempo que una cabeza de lectura/escritura re¬ 
quiere para localizar un registro deseado en un dispositivo 
de memoria de disco de computadora una vez que la cabe¬ 
za se ha colocado sobre la pista correcta. Si los discos giran 
una vez cada 25 milisegundos, una suposición razonable es 
que X está uniformemente distribuida en el intervalo [0, 25]. 

a. Calcule P(10<X< 20). 

b. Calcule P(X >10). 

c. Obtenga la función de distribución acumulativa F(X). 

d. Calcule E(X) y a x . 

99. Una barra de 12 pulg que está sujeta por ambos extremos se 
somete a una cantidad creciente de esfuerzo hasta que 
se rompe. Sea Y = la distancia del extremo izquierdo al 
punto donde ocurre la ruptura. Suponga que Y tiene la fun¬ 
ción de densidad de probabilidad 


f(y ) 



o 



0<y< 12 
de lo contrario 


Calcule lo siguiente: 

a. La función de densidad de probabilidad de Y y dibújela. 

b. P(Y < 4), P(Y > 6 ) y P(4 < Y < 6 ) 

c. E(Y), EiY 2 ) y V(Y). 

d. La probabilidad de que el punto de ruptura ocurra a más 
de 2 pulg del punto de ruptura esperado. 

e. La longitud esperada del segmento más corto cuando 
ocurre la ruptura. 


100. Sea X el tiempo hasta la falla (en años) de cierto compo¬ 
nente hidráulico. Suponga que la función de densidad de 

probabilidad de X es f[x) = 32/(x + 4 ) 3 con x > 0. 

a. Verifique que/fjt) es una función de densidad de proba¬ 
bilidad legítima. 

b. Determine la función de distribución acumulativa. 

c. Use el resultado del inciso b) para calcular la probabi¬ 
lidad de que el tiempo hasta la falla esté entre dos y cin¬ 
co años. 

d. ¿Cuál el tiempo esperado hasta la falla? 

e. Si el componente tiene un valor de recuperación igual a 
100/(4 + x) cuando su tiempo para la falla es x, ¿cuál 
es el valor de recuperación esperado? 


101. El tiempo X para la terminación de cierta tarea tiene una 
función de distribución acumulativa F(x) dada por 



x < 0 
0<x< 1 





x 


1 _ 

3 


a. Obtenga la función de densidad de probabilidad f{x) y 
trace su gráfica. 

b. Calcule P(0.5 < X < 2). 

c. Calcule E(X). 
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102 . Se sabe que el voltaje de ruptura de un diodo seleccionado 
al azar de cierto tipo está normalmente distribuido con va¬ 
lor medio de 40 V y desviación estándar de 1.5 V. 

a. ¿Cuál es la probabilidad de que el voltaje de un solo 
diodo esté entre 39 y 42? 

b. ¿Qué valor es tal que sólo 15% de todos los diodos ten¬ 
gan voltajes que excedan ese valor? 

c. Si se seleccionan cuatro diodos independientemente, 
¿cuál es la probabilidad de que por lo menos uno tenga 
un voltaje de más de 42? 

103 . El artículo “Computer Assisted Net Weight Control” ( Qua- 
lity Progress, 1983: 22-25) sugiere una distribución normal 
con media de 137.2 oz y desviación estándar de 1.6 oz del 
contenido de frascos de cierto tipo. El contenido declarado 
fue de 135 oz. 

a. ¿Cuál es la probabilidad de que un solo frasco conten¬ 
ga más que el contenido declarado? 

b. Entre diez frascos seleccionados al azar, ¿cuál es la pro¬ 
babilidad de que por lo menos ocho contengan más del 
contenido declarado? 

c. Suponiendo que la media permanece en 137.2, ¿a qué 
valor se tendría que cambiar la desviación estándar de 
modo que 95% de todos los frascos contengan más que 
el contenido declarado? 

104 . Cuando tarjetas de circuito utilizadas en la fabricación de 
reproductores de discos compactos se someten a prueba, 
el porcentaje de tarjetas defectuosas es de 5%. Suponga 
que se recibió un lote de 250 tarjetas y que la condición 
de cualquier tarjeta particular es independiente de las 
demás. 

a. ¿Cuál es la probabilidad aproximada de que por lo 
menos 10 % de las tarjetas en el lote sean defectuosas? 

b. ¿Cuál es la probabilidad aproximada de que haya exac¬ 
tamente 10 defectuosas en el lote? 

105 . El artículo “Characterization of Room Temperature Dam- 
ping in Aluminum-Indium Alloys” (Metallurgical Trans. 
1993: 1611-1619) sugiere que el tamaño de grano de ma¬ 
triz Al (/u,m) de una aleación compuesta de 2% de indio 
podría ser modelado con una distribución normal con valor 
medio de 96 y desviación estándar de 14. 

a. ¿Cuál es la probabilidad de que el tamaño de grano ex¬ 
ceda de 100 ? 

b. ¿Cuál es la probabilidad de que el tamaño de grano esté 
entre 50 y 80? 

c. ¿Qué intervalo (a, b ) incluye 90% central de todos los 
tamaños de grano (de modo que 5% esté por debajo de 
a y 5% por encima de b)7 

106 . El tiempo de reacción (en segundos) a un estímulo es una 
variable aleatoria continua con función de densidad de pro¬ 
babilidad 


í 3 . 1 

f(x)=\ 2 x 2 

l 0 


1 3 

de lo contrario 


a. Obtenga la función de distribución acumulativa. 

b. ¿Cuál es la probabilidad de que el tiempo de reacción 
sea cuando mucho de 2.5 s? ¿De entre 1.5 y 2.5 s? 

c. Calcule el tiempo de reacción esperado. 

d. Calcule la desviación estándar del tiempo de reacción. 


e. Si un individuo requiere más de 1.5 s para reaccionar a 
una luz que se enciende y permanece encendida hasta que 
transcurre un segundo más o hasta que la persona reaccio¬ 
na (lo que suceda primero). Determine la cantidad de 
tiempo esperado de que la luz permanezca encendida. 
[Sugerencia: Sea h{X) = el tiempo que la luz está encen¬ 
dida como una función del tiempo de reacción X.] 


107 . 


Sea X la temperatura a la cual ocurre una reacción química. 
Suponga que X tiene una función de densidad de probabilidad 


m 



-1 < x <2 
de lo contrario 


a. Trace la gráfica de f(x). 

b. Determine la función de distribución acumulativa y 
dibújela. 

c. ¿Es cero la temperatura mediana a la cual ocurre la 
reacción? Si no, ¿es la temperatura mediana menor o 
mayor que cero? 

d. Suponga que esta reacción es independientemente reali¬ 
zada una vez en cada uno de diez laboratorios diferentes 
y que la función de densidad de probabilidad del tiempo 
de reacción en cada laboratorio es como se da. Sea Y = 
el número entre los diez laboratorios en los cuales la 
temperatura excede de uno. ¿Qué clase de distribución 
tiene Y7 (Dé el nombre y valores de los parámetros.) 

108 . El artículo “Determination of the MTF of Positive Photore- 
sists Using the Monte Cario Method” ( Photographic Sci. 
andEngr., 1983: 254-260) propone la distribución exponen¬ 
cial con parámetro A = 0.93 como modelo de la distribución 
de una longitud de trayectoria libre de fotones (gm) en cier¬ 
tas circunstancias. Suponga que éste es el modelo correcto. 

a. ¿Cuál es la longitud de trayectoria esperada y cuál es su 
desviación estándar? 

b. ¿Cuál es la probabilidad de que la longitud de trayecto¬ 
ria exceda de 3.0? ¿Cuál es la probabilidad de que la 
longitud de trayectoria esté entre 1.0 y 3.0? 

c. ¿Qué valor es excedido por sólo 10% de todas las lon¬ 
gitudes de trayectoria? 

109 . El artículo “The Prediction of Corrosión by Statistical 
Analysis of Corrosión Profiles” ( Corrosión Science , 1985: 
305-315) sugiere la siguiente función de distribución acumu¬ 
lativa de la profundidad X de la picadura más profunda en 
un experimento que implica la exposición de acero al man¬ 
ganeso de carbono a agua de mar acidificada. 

F{x\ a, j 8 ) = e -* Hx ~ ayí> -c» < jc < 00 

Los autores proponen los valores a = 150 y /3 = 90. Su¬ 
ponga que éste es el modelo correcto. 

a. ¿Cuál es la probabilidad de que la profundidad de la pi¬ 
cadura más profunda sea cuando mucho de 150? 
¿Cuándo mucho 300? ¿De entre 150 y 300? 

b. ¿Por debajo de qué valor será observada la profundidad de 
la picadura máxima en 90% de todos los experimentos? 

c. ¿Cuál es la función de densidad de X7 

d. Se puede demostrar que la función de densidad es unimo- 
dal (una sola cresta). ¿Por encima de qué valor sobre el eje 
de medición ocurre esta cresta? (Este valor es el modo.) 

e. Se puede demostrar que E(X) ~ 0.5772/3 + a. ¿Cuál 
es la media de los valores dados de a y /3 y cómo se 
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compara con la mediana y el modo? Trace la gráfica de 
la función de densidad. [Nota: Ésta se conoce como 
distribución de valor extremo más grande.] 

110 . Un componente tiene una duración X exponencialmente 
distribuida con parámetro A. 

a. Si el costo de operación por unidad de tiempo es c, 
¿cuál es el costo esperado de operación de este compo¬ 
nente durante el tiempo que dura? 

b. En lugar de un coeficiente de costos constante como en 
el inciso a), suponga que el coeficiente de costos es 
c(l — 0.5e'“) con a < 0, de modo que el costo por uni¬ 
dad de tiempo es menor que c cuando el componente es 
nuevo y se vuelve más caro a medida que el componen¬ 
te envejece. Ahora calcule el costo de operación espe¬ 
rado durante la duración del componente. 

111 . La moda de una distribución continua es el valor x que in¬ 
crementa al máximo/(x). 

a. ¿Cuál es la moda de una distribución normal con pará¬ 
metros p y cr? 

b. ¿Tiene una sola moda la distribución uniforme con pa¬ 
rámetros A y B7 ¿Por qué sí o por qué no? 

c. ¿Cuál es la moda de una distribución exponencial con 
parámetro A? (Trace una gráfica.) 

d. Si X tiene una distribución gama con parámetros a y j8 y 
a > 1, halle la moda [Sugerencia'. ln[/(x)] se incremen¬ 
tará al máximo si y sólo si f(x) es, y puede ser más sim¬ 
ple considerar la derivada de 1 n \f(x) |. 

e. ¿Cuál es la moda de una distribución ji cuadrada con v 
grados de libertad? 

112 . El artículo “Error Distribution in Navigation” ( J. Institute of 
Navigation, 1971: 429-442) sugiere que una distribución 
exponencial reproduce con más o menos precisión a una 
distribución de frecuencia de errores positivos (magnitudes 
de errores). Sea X = el error de posición lateral (millas náu¬ 
ticas), el cual puede ser positivo o negativo. Suponga que la 
función de densidad de probabilidad de X es 

f(x) — (0.1)e~~\ z \ -oo < x < oo 

a. Trace una gráfica de /(x) y compruebe que /(x) es una 
función de densidad de probabilidad legítima (demues¬ 
tre que se integra a 1). 

b. Obtenga la función de distribución acumulativa de X y 
trácela. 

c. Calcule P(X < 0), P(X < 2), P(-l < X < 2), y la pro¬ 
babilidad de cometer un error de más de dos millas. 


113 . En algunos sistemas, un cliente es asignado a una o dos pres¬ 
tadoras de servicios. Si el tiempo para que el cliente sea aten¬ 
dido por la prestadora de servicios i tiene una distribución 
exponencial con parámetro A ¡(i = 1,2) y p es la proporción de 
todos los clientes atendidos por la prestadora de servicios 1, 
entonces la función de densidad de probabilidad de X = el 
tiempo para ser atendido de un cliente seleccionado al azar es 


/(*; Aj, A 2 , p) 



+ (1 — p) A 2 e x a 0 

0 de lo contrario 


Ésta a menudo se llama distribución hiperexponencial o ex¬ 
ponencial combinada. Esta distribución también se propone 
como modelo de la cantidad de lluvia en “Modeling Mon- 
soon Affected Rainfall of Pakistán by Point Processes” ( J. 
Water Resources Planning and Mgmnt., 1992: 671-688). 
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a. Verifique que/(x; Aj, A 2 , p) es una función de densidad 
de probabilidad. 

b. ¿Cuál es la función de distribución acumulativa F(x: A j, 

A 2 ,p)? 

c. Si/(x;Aj,A 2 , p) es la función de densidad de probabili¬ 
dad de X, ¿cuál es E(X)7 

d. Utilizando el hecho de que E(X 2 ) = 2/A 2 cuando X tiene 
una distribución exponencial con parámetro A, calcule 
E{X 1 ) cuando X tiene la función de densidad de proba¬ 
bilidad /(x; Aj, A 2 , p). Luego calcule V(X). 

e. El coeficiente de variación de una variable aleatoria (o dis¬ 
tribución) es CV = cr/p. ¿Cuál es CV para una variable 
aleatoria exponencial? ¿Qué puede decir sobre el valor de 
CV cuando X tiene una distribución hiperexponencial? 

f. ¿Cuál es el CV de una distribución Erlang con paráme¬ 
tros Ayn como se definen en el ejercicio 68 ? [Nota: En 
trabajo aplicado, el CV muestral se utiliza para decidir 
cuál de las tres distribuciones podría ser apropiada.] 

114 . Suponga que en un estado particular se permite que las per¬ 
sonas físicas que presentan su declaración de impuestos de¬ 
tallen sus deducciones sólo si el total de las deducciones 
detalladas es por lo menos de $5 000. Sea A (en miles de dó¬ 
lares) el total de deducciones detalladas en un formulario 
seleccionado al azar. Suponga que X tiene la función de 
densidad de probabilidad 

f k/X a x > 5 
r(x; a) — j „ 

10 de lo contrario 

a. Encuentre el valor de k. ¿Qué restricción en a es necesaria? 

b. ¿Cuál es la función de distribución acumulativa de X7 

c. ¿Cuál es la deducción total esperada en un formulario 
seleccionado al azar? ¿Qué restricción en a es necesa¬ 
ria para que E(X) sea finita? 

d. Demuestre que ln(A/5) tiene una distribución exponen¬ 
cial con parámetro a — 1 . 

115 . Sea I¡ la corriente de entrada a un transistor e I 0 la corrien¬ 
te de salida. En ese caso la ganancia de corriente es pro¬ 
porcional a 1 n(/ 0 // ¿ ). Suponga que la constante de 
proporcionalidad es 1 (lo que conduce a seleccionar una 
unidad de medición particular), así que la ganancia de co¬ 
rriente = X = ln(/o//,-). Suponga que X está normalmente 
distribuida con p = 1 y cr = 0.05. 

a. ¿Qué tipo de distribución tiene la razón IJip. 

b. ¿Cuál es la probabilidad de que la corriente de salida 
sea más de dos veces la corriente de entrada? 

c. ¿Cuáles son el valor esperado y la varianza de la razón 
de corriente de salida a corriente de entrada? 

116 . El artículo “Response of SiC/Si 3 N 4 Composites Under 
Static and Cyclic Loading-An Experimental and Statistical 
Analysis” (J. of Engr. Materials and Technology, 1997: 
186-193) sugiere que la resistencia a la tensión (MPa) de 
compuestos en condiciones especificadas puede ser mode¬ 
lada por una distribución de Weibull con a = 9 y j 8 = 180. 

a. Trace una gráfica de la función de densidad. 

b. ¿Cuál es la probabilidad de que la resistencia de un es¬ 
pécimen seleccionado al azar exceda de 175? ¿Sea de 
entre 150 y 175? 

c. Si se seleccionan al azar dos especímenes y sus resistencias 
son independientes entre sí, ¿cuál es la probabilidad de que 
por lo menos uno tenga una resistencia entre 150 y 175? 
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CAPÍTULO 4 Variables aleatorias continuas y distribuciones de probabilidad 


d. ¿Qué valor de resistencia separa al 10% de todos los es¬ 
pecímenes más débiles del 90% restante? 

117 . Si Z tiene una distribución normal estándar, defina una 
nueva variable aleatoria Y como Y — <xZ + fx. Demuestre 
que Y tiene una distribución normal con parámetros ¡x y <x. 
[Sugerencia: Y £ y si y sólo si Z £ ? Use ésta para definir 
la función de distribución acumulativa de y y luego derí¬ 
vela con respecto a y.] 

118 . a. Suponga que la duración A de un componente, medida 

en horas, tiene una distribución gama con parámetros 
ay ¡i. Sea Y = la duración medida en minutos. Deduzca 
la función de densidad de probabilidad de Y. [Sugerencia: 
Y £ y si y sólo si X £ y/60. Use esto para obtener la fun¬ 
ción de distribución acumulativa de Y y luego derívela pa¬ 
ra obtener la función de densidad de probabilidad.] 

b. Si X tiene una distribución gama con parámetros ay ¡i, 
¿cuál es la distribución de probabilidad de Y = cXl 

119 . En los ejercicios 111 y 112, así como también en muchas 
otras situaciones, se tiene la función de densidad de proba¬ 
bilidad/( jc) de X y se desea conocer la función de densidad 
de probabilidad de Y = h{X). Suponga que /?(•) es una fun¬ 
ción invertible, de modo que y = h{x) se resuelve para x a 
fin de obtener x = k{y). Entonces se puede demostrar que 
la función de densidad de probabilidad de Y es 

g(y) =flKy)] ■ \k'(y)\ 

a. Si X tiene una distribución uniforme con A = 0 y B = 1, 
derive la función de densidad de probabilidad de Y = 
—ln(X). 

b. Resuelva el ejercicio 117, utilizando este resultado. 

c. Resuelva el ejercicio 118(b), utilizando este resultado. 

120 . Basado en los datos del experimento de lanzamiento de dar¬ 
do, el artículo “Shooting Darts” ( Chance , verano de 1997: 
16-19) propuso que los errores horizontales y verticales al 
apuntar a un blanco deben ser independientes unos de 
otros, cada uno con una distribución normal con media 0 y 
varianza a 2 . Se puede demostrar entonces que la distancia 
V del blanco al punto de aterrizaje es 

/(v) = — • e~ v2/2<r2 v > 0 
o~ 

a. ¿De qué familia introducida en este capítulo es esta 
función de densidad de probabilidad? 

b. Si cr = 20 mm (cerca del valor sugerido por el artículo), 
¿Cuál es la probabilidad de que un dardo aterrice dentro 
de 25 mm (aproximadamente una pulg) del blanco? 

121 . El artículo “Three Sisters Give Birth on the Same Day” 
(Chance , primavera de 2001, 23-25) utilizó el hecho de que 
tres hermanas de Utah dieron a luz el 11 de marzo de 1998 
como base para plantear algunas preguntas interesantes con 
respecto a coincidencias de fechas de nacimiento. 

a. No haciendo caso del año bisiesto y suponiendo que los 
otros 365 días son igualmente probables, ¿cuál es la 
probabilidad de que tres nacimientos seleccionados al 
azar ocurran el 11 de marzo? Asegúrese de indicar qué, 
si las hay, suposiciones adicionales está haciendo. 

b. Con las suposiciones utilizadas en el inciso a), ¿cuál es 
la probabilidad de que tres nacimientos seleccionados 
al azar ocurran el mismo día? 

c. El autor sugirió, basado en datos extensos, que el tiempo 
de gestación (tiempo entre la concepción y el nacimiento) 


podía ser modelado como si tuviera una distribución 
normal con valor medio de 280 días y desviación están¬ 
dar de 19.88 días. Las fechas esperadas para las tres her¬ 
manas de Utah fueron el 15 de marzo, el 1 de abril y el 
4 de abril, respectivamente. Suponiendo que las tres fe¬ 
chas esperadas están en la media de la distribución, 
¿cuál es la probabilidad de que los nacimientos ocurrie¬ 
ran el 11 de marzo? [Sugerencia: La desviación de la fe¬ 
cha de nacimiento con respecto a la fecha esperada está 
normalmente distribuida con media 0.] 

d. Explique cómo utilizaría la información del inciso c) 
para calcular la probabilidad de una fecha de nacimien¬ 
to común. 


122 . 


Sea X la duración de un componente, conflx) y F(x) la fun¬ 
ción de densidad de probabilidad y la función de distribución 
acumulativa de X. La probabilidad de que el componente fa¬ 
lle en el intervalo (x, x + Ax) es aproximadamente fix) • Ax. 
La probabilidad condicional de que falle en (x, x + Ax) dado 
que ha durado por lo menos x es/(x) • Ax/[1 — F(xj ]. Divi¬ 
diendo ésta entre Ax se produce la función de coeficiente 
de falla: 


r{x) = 


f(x) 


1 - F(x) 

Una función de coeficiente de falla creciente indica que la 
probabilidad de que los componentes viejos se desgasten 
es cada vez más grande, mientras que un coeficiente de falla 
decreciente evidencia una confiabilidad cada vez más 
grande con la edad. En la práctica, a menudo se supone una 
falla “en forma de tina de baño”. 

a. Si X está exponencialmente distribuida, ¿cuál es r(x)? 

b. Si X tiene una distribución de Weibull con parámetros 
ay ¡i, ¿cuál es r(x)? ¿Con qué valores de parámetros se 
incrementará r(x)l ¿Con qué valores de parámetro de¬ 
crecerá r(x) con x? 

c. Como rix) = —(d/¿x)ln[l — F(x)], ln[l — F(x)] = —f r(x) 
dx. Suponga 


r(x) = 



0<x</3 
de lo contrario 


de modo que si un componente dura )3 horas, durará por 
siempre (si bien parece irrazonable, este modelo puede 
ser utilizado para estudiar el “desgaste inicial”). ¿Cuá¬ 
les son la función de distribución acumulativa y la fun¬ 
ción de densidad de probabilidad de XI 

123 . Sea que U tenga una distribución uniforme en el intervalo 
[0, 1]. Entonces los valores observados que tienen esta dis¬ 
tribución se obtienen con un generador de números aleato¬ 
rios de computadora. Sea A = —(1/A)ln(l — U). 

a. Demuestre que X tiene una distribución exponencial 
con parámetro A. [Sugerencia: La función de distribu¬ 
ción acumulativa de X es F(x) = P(A < x); A £ x equi¬ 
vale aí/<?] 

b. ¿Cómo utilizaría el inciso a) y un generador de números 
aleatorios para obtener valores observados derivados de 
una distribución exponencial con parámetro A = 10? 

124 . Considere una variable aleatoria con media ¡x y desviación 
estándar cr y sea g(X) una función especificada de A. La 
aproximación de la serie de Taylor de primer grado a g(A) 
en la cercanía de ¿i es 

g(X) » gQL) + g\¡x) • (A -ix) 
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El miembro del lado derecho de esta ecuación es una función 
lineal de X. Si la distribución de X está concentrada en un in¬ 
tervalo a lo largo del cual g(-) es aproximadamente lineal 
[p. ej., Vr es aproximadamente lineal en (1, 2)], entonces la 
ecuación produce aproximaciones a E(g(X)) y V(g(X)). 

a. Dé expresiones para estas aproximaciones. [Sugeren¬ 
cia: Use reglas de valor esperado y varianza de una fun¬ 
ción lineal aX + 

b. Si el voltaje v a través de un medio se mantiene fijo 
pero la corriente 1 es aleatoria, entonces la resistencia 
también será una variable aleatoria relacionada con / 
por R = v/I. Si ¿i, = 20 y a, — 0.5, calcule aproxima¬ 
ciones a fj, R y a R . 

125 . Una función g(x ) es convexa si la cuerda que conecta dos 
puntos cualesquiera de su gráfica quedan sobre ésta. Cuan¬ 
do g(x ) es derivable, una condición equivalente es que pa¬ 
ra cada x, la línea tangente en x queda por completo sobre 
o debajo de la gráfica. (Véanse las figuras a continuación.) 
¿Cómo se compara g(¿i) = g{E{X)) con E{g{X))'l [Sugeren¬ 
cia: La ecuación de la línea tangente en x = p es y = 
g(/ 1 ) + g'(p) • {x — p). Use la condición de convexidad, 
sustituya x por X y considere los valores esperados. Nota: 
A menos que g(.r) sea lineal, la desigualdad resultante (por 
lo general llamada desigualdad de Jensen) es estricta (< en 
lugar de £); es válida tanto con variables aleatorias conti¬ 
nuas como discretas.] 
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126 . Si X tiene una distribución de Weibull con parámetros a = 
2 y jS, demuestre que Y = 2X 2 /¡3 2 tiene una distribución ji 
cuadrada con v = 2. [Sugerencia: La función de distribución 
acumulativa de Y es P(Y £ y); exprese esta probabilidad en 
la forma P(X £ g(y)), use el hecho de que X tiene una fun¬ 
ción de distribución acumulativa de la forma de la expresión 
(4.12) y derive con respecto a y para obtener la función de 
densidad de probabilidad de Y.\ 

127 . El registro crediticio de un individuo es un número calcu¬ 
lado basado en el historial crediticio de dicho individuo el 
cual ayuda a un prestamista a determinar cuánto se le pue¬ 
de prestar o qué límite de crédito debe ser establecido 
para una tarjeta de crédito. Un artículo en los Los Angeles 
Times presentó datos que sugerían que una distribución 
beta con parámetros A = 150 y B = 850, a = 8, ¡i = 2 pro¬ 
porcionaría una aproximación razonable a la distribución 
de registros de crédito estadounidenses [Nota: Los regis¬ 
tros de crédito son valores enteros], 

a. Sea X un registro estadounidense de crédito selecciona¬ 
do al azar. ¿Cuáles son el valor medio y la desviación 
estándar de esta variable aleatoria? ¿Cuál es la probabi¬ 
lidad de que X esté dentro de una desviación estándar 
de su valor medio? 

b. ¿Cuál es la probabilidad aproximada de que un registro 
seleccionado al azar excederá de 750 (lo que los presta¬ 
mistas consideran un muy buen registro)? 

128 . Sea V el volumen de lluvia y W el volumen de escurrimien- 
to (ambos en mm). De acuerdo con el artículo “Runoff 
Quality Analysis of Urban Catchments with Analytical 
Probability Models” (7. of Water Resource Planning and 
Management, 2006: 4-14), el volumen de escurrimiento 
será 0 si V £ v d y será k(V — v d ) si V > v d . Aquí v d es el 
volumen de almacenamiento en una depresión (una cons¬ 
tante) y k (también una constante) es el coeficiente de es¬ 
currimiento. El artículo citado propone una distribución 
exponencial con parámetro A para V. 

a. Obtenga una expresión para la función de distribución 
acumulativa de W. [Nota: W no es ni puramente conti¬ 
nua ni puramente discreta; en cambio tiene una distri¬ 
bución “combinada” con un componente discreto en 0 
y es continua con valores w > 0.] 

b. ¿Cuál es la función de densidad de probabilidad de W 
con w > 0? Usela para obtener una expresión para el 
valor esperado de volumen de escurrimiento. 
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dones de 
lidad conjunta 
:ras aleatorias 


INTRODUCCIÓN 


En los capítulos 3 y 4 se estudiaron modelos de probabilidad para una sola variable 
aleatoria. Muchos problemas de probabilidad y estadística implican diversas varia¬ 
bles aleatorias al mismo tiempo. En este capítulo, primero se discuten modelos de 
probabilidad del comportamiento conjunto (es decir, simultáneo) de diversas varia¬ 
bles aleatorias, con énfasis especial en el caso en el cual las variables son independien¬ 
tes una de otra. Enseguida se estudian los valores esperados de funciones de diversas 
variables aleatorias, incluidas la covarianza y la correlación como medidas del grado de 
asociación entre dos variables. 

Las últimas tres secciones del capítulo consideran funciones de n variables alea¬ 
torias X,, X 2 , , X n , con un enfoque especial en su promedio (X, + • ■ • + X n )/n. 

A cualquier función de esta clase, que por sí misma es una variable aleatoria, se le lla¬ 
ma estadística. Se utilizan métodos de probabilidad para obtener Información sobre 
la distribución de un estadístico. El resultado principal de este tipo es el Teorema del 
Límite Central (TLC), la base de muchos procedimientos inferenciales que implican 
tamaños de muestra grandes 


O 
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5.1 Variables aleatorias conjuntamente distribuidas 


Existen muchas situaciones experimentales en las cuales más de una variable aleatoria será 
de interés para un investigador. Primero se consideran las distribuciones de probabilidad 
conjunta para dos variables aleatorias discretas, enseguida para dos variables continuas y 
por último para más de dos variables. 

Dos variables aleatorias discretas 

La función masa de probabilidad (fmp) de una sola variable aleatoria discreta X especifica 
cuánta masa de probabilidad está colocada en cada valor posible de X. La función masa de 
probabilidad conjunta de dos variables aleatorias discretas X y Y describe cuánta masa de pro¬ 
babilidad se coloca en cada par posible de valores ( x , y). 



DEFINICIÓN 


Sean X y Y dos variables aleatorias discretas definidas en el espacio muestral S de un 
experimento. La función masa de probabilidad conjunta p(x, y) se define para cada 
par de números (x, y) como 

p(x, y) = P(X = x y Y = y) 

Debe cumplirse que p(x, y) > 0 y ES p(x,y) = 1. 

x y 

Ahora sea A cualquier conjunto compuesto de pares de valores ( x , y) (p. ej., A = { (x, y): 
x + y = 5} o { (x, y): má\(x, y) < 3}). Entonces la probabilidad P\(X, Y) G A] se obtiene 
sumando la función masa de probabilidad conjunta incluidos todos los pares en A: 

P[(X, Y) G A] = 2 I p(x, y) 

(x, y) <E A 



Ejemplo 5.1 Una gran agencia de seguros presta servicios a numerosos clientes que han adquirido tanto 
una póliza de propietario de casa como una póliza de automóvil en la agencia. Por cada tipo 
de póliza, se debe especificar una cantidad deducible. Para una póliza de automóvil, las 
opciones son $100 y $250, mientras que para la póliza de propietario de casa, las opciones 
son 0, $100 y $200. Suponga que se selecciona al azar un individuo con ambos tipos de póli¬ 
za de los archivos de la agencia. Sea X = la cantidad deducible sobre la póliza de auto y Y 
= la cantidad deducible sobre la póliza de propietario de casa. Los posibles pares (X, Y) son 
entonces (100, 0), (100, 100), (100, 200), (250, 0), (250, 100) y (250, 200); la función masa 
de probabilidad conjunta especifica la probabilidad asociada con cada uno de estos pares, 
con cualquier otro par tiene probabilidad cero. Suponga que la tabla de probabilidad con¬ 
junta siguiente da la función masa de probabilidad conjunta: 


y 


p(x, y) 

0 

100 

200 


100 

0.20 

0.10 

0.20 


250 

0.05 

0.15 

0.30 


Entonces ¿>(100, 100) = P(X = 100 y Y = 100) = P( $ 100 deducible sobre ambas pólizas) 
= 0.10. La probabilidad P{Y > 100) se calcula sumando las probabilidades de todos los 
pares (x , y) para los cuales y > 100: 

P(Y> 100) = ¿>(100, 100) + ¿>(250, 100) + ¿-(100, 200) + ¿-(250, 200) 
























CAPITULO 5 Distribuciones de probabilidad conjunta y muestras aleatorias 


La función masa de probabilidad de una de las variables sola se obtiene sumando p(x, 
y) con los valores de la otra variable. El resultado se llama función masa de probabilidad 
marginal cuando los valores p(x, y) aparecen en una tabla rectangular, las sumas son totales 
marginales (filas o columnas). 


DEFINICIÓN 


Las funciones masa de probabilidad marginal de X y de Y, denotadas por p x (x) y 
Py{y), respectivamente, están dadas por 

PxOd = 2 p( x > y ) Pr(y) = X p( x ’ y) 

y x 


Así pues para obtener la función masa de probabilidad marginal de X evaluada en, por ejem¬ 
plo, x = 100, las probabilidades p(100, y) se suman con todos los valores posibles de y. Si se 
hace esto por cada valor posible de X se obtiene la función masa de probabilidad marginal 
de X sola (sin referencia a Y). Con las funciones masa de probabilidad marginal, se pueden 
calcular las probabilidades de eventos que implican sólo X o sólo Y. 


Ejemplo 5.2 

(continuación 
del ejemplo 
5.1) 


Los valores posibles de X son x = 100 y x = 250, por lo que si se calculan los totales en las 
filas de la tabla de probabilidad conjunta se obtiene 

p x (100) = p(100, 0) + p(100, 100) + p(100, 200) = 0.50 

y 


Px( 250) = p(250, 0) + p( 250, 100) + p( 250, 200) = 0.50 


La función masa de probabilidad marginal de X es entonces 


PxW 


Í0.5 x= 100, 250 
[O de lo contrario 


Asimismo, la función masa de probabilidad marginal de Y se obtiene con los totales de las 
columnas como 


PÁy) 


0.25 y = 0, 100 
0.50 y = 200 
0 de lo contrario 


Por lo tanto, P(F > 


100) = Py( 100) + Py(200) = 0.75 como antes. 


Dos variables aleatorias continuas 

La probabilidad de que el valor observado de una variable aleatoria continua X esté en un 
conjunto unidimensional A (tal como un intervalo) se obtiene integrando la función de den¬ 
sidad de probabilidad fix) a lo largo del conjunto A. Asimismo, la probabilidad de que el par 
(A, Y) de variables aleatorias continuas quede en un conjunto A en dos dimensiones (tal como 
un rectángulo) se obtiene integrando una función llamada función de densidad conjunta. 


DEFINICIÓN 


Sean X y Y variables aleatorias continuas. Una función de densidad de probabili¬ 
dad conjunta fix, y) de estas dos variables es una función que satisface fix, y) > 0 
y ( J f(x, y) dx dy = 1. Entonces para cualquier conjunto A en dos dimensiones 


P[(X, Y) G A] = J Jf(x, y) dx dy 

A 

ectángulo {(x, y): a < x < b, c < y : 

P[(X, Y) G A] = P(a <X<b, c ^ Y < d) = f J f(x, y) dy dx 


En particular, si A es el rectángulo ¡(x, y): a < x < b, c < v íT t/}, entonces 

rb rd 
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Ejemplo 5.3 


e 
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Se puede considerar que f(x, y ) especifica una superficie situada a una altura f(x, y) 
sobre el punto ( x , y) en un sistema de coordenadas tridimensional. Entonces P[(X, Y) G A] 
es el volumen debajo de esta superficie y sobre la región A, similar al área bajo una curva en 
el caso unidimensional. Esto se ilustra en la figura 5.1. 


f(x, y ) y 



Figura 5.1 P{X, Y) e A = volumen bajo la superficie de densidad sobre A. 


Un banco dispone tanto de una ventanilla para automovilistas como de una ventanilla nor¬ 
mal. En un día seleccionado al azar, sea X = la proporción de tiempo que la ventanilla 
para automovilistas está en uso (por lo menos un cliente está siendo atendido o está esperan¬ 
do ser atendido) y Y = la proporción del tiempo que la ventanilla normal está en uso. Entonces 
el conjunto de valores posibles de (X, Y ) es el rectángulo D = { (x, y): 0 < x < 1,0 < y < 1 ¡. 
Suponga que la función de densidad de probabilidad conjunta de (X, Y) está dada por 


/(■*, y) 


6 

5 


(x + y 2 ) 


0 


x < l,0áv< 1 


0 de lo contrario 


Para verificar que ésta es una función de densidad de probabilidad legítima, obsérvese que 
f(x, y) > 0 y 


[ f f(x, y) dx dy = [ f — (x + y 2 ) dx dy 


o J o 5 

i ,1 6 


f 1 f 1 6 r 1 f 1 6 

— x dx dy + — y 2 dx dy 

-'o J 0 5 ' J n Al 5 


f 1 6 J [‘ 

— — x dx + 

J 0 5 J n 


o J o 5 

6 6 6 

— y 1 dy =-1-= 1 

'o 5 y y 10 15 


La probabilidad de que ninguna ventanilla esté ocupada más de un cuarto del tiempo es 


P^O < X < 0 < 



,1/4,1/4 g 

-'o 5 


(x + y 2 ) dx dy 


6 r 1/4(-1/4 6 ,1/4,1/4 

x dx dy + — y 2 dx dy 

•'n 5 •'n J n 


5 J o J o 

6 x 2 x =U4 
20 ’ 2 


5 -'o J o 

6 y 3 i’= 1 / 4 

+ 2Ó'^ y =o 


7 

640 


= .0109 


Como con las funciones masa de probabilidad conjunta, con la función de densidad de 
probabilidad conjunta de X y Y, se puede calcular cada una de las dos funciones de densi¬ 
dad marginal. 



























CAPITULO 5 Distribuciones de probabilidad conjunta y muestras aleatorias 


DEFINICIÓN 


Ejemplo 5.4 

(continuación 
del ejemplo 
5.3) 


Ejemplo 5.5 


Las funciones de densidad de probabilidad marginal de X y Y, denotadas por f x (x) 
yfyiy), respectivamente, están dadas por 

00 

f(x, y ) dy con < x < °° 

-00 
00 

/( x, y) dx con < y < °° 


fx( x ) = J 

f Y (y) = í 


La función de densidad de probabilidad marginal de X, la cual da la distribución de proba¬ 
bilidad del tiempo que permanece ocupada la ventanilla para automovilistas sin referencia 
a la ventanilla normal, es 

r f 1 6,62 

fx(x) = f(x, y) dy = — (x + y 2 ) dy = — x + — 

J —oo J Q J J J 


con O < x < 1 y O de lo contrario. La función de densidad de probabilidad marginal de Y es 


M>) 



O <y < 1 

de lo contrario 


Entonces 




r 3/4 37 

I f Y (y) dy = — = 0.4625 

J 1/4 oO 


En el ejemplo 5.3, la región de densidad conjunta positiva fue un rectángulo, el cual 
facilitó el cálculo de las funciones de densidad de probabilidad marginal. Considere ahora 
un ejemplo en el cual la región de densidad positiva es más complicada. 


Una compañía de nueces comercializa latas de nueces combinadas de lujo que contienen 
almendras, nueces de acajú y cacahuates. Suponga que el peso neto de cada lata es exacta¬ 
mente de 1 Ib, pero la contribución al peso de cada tipo de nuez es aleatoria. Como los tres 
pesos suman 1, un modelo de probabilidad conjunta de dos cualquiera da toda la informa¬ 
ción necesaria sobre el peso del tercer tipo. Sea X = el peso de las almendras en una lata 
seleccionada y Y = el peso de las nueces de acajú. Entonces la región de densidad positiva es 
D = {(ij):0£j£ 1, O — V — 1, x + y ^ 1 j, región sombreada ilustrada en la figura 5.2. 


y 



Figura 5.2 Región de densidad positiva para el ejemplo 5.5. 


Ahora sea la función de densidad de probabilidad conjunta de (X, Y) 


f(x, y) 


í 24xy l,OS)i< 1, x + y ^ 1 

[O de lo contrario 
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Con cualquier x fija,/(x, y) se incrementa con y; con y fija,/(x, y) se incrementa con x. Esto 
es apropiado porque las palabras de lujo implican que la mayor parte de la lata deberá estar 
compuesta de almendras y nueces de acajú en lugar de cacahuates, así que la función de 
densidad deberá ser grande cerca del límite superior y pequeña cerca del origen. La super¬ 
ficie determinada por f(x, y) se inclina hacia arriba desde cero a medida que (x, y) se alejan 
de uno u otro eje. 

Claramente,/(x, y) > 0. Para verificar la segunda condición sobre una función de den¬ 
sidad de probabilidad conjunta, recuérdese que una integral doble se calcula como una inte¬ 
gral iterada manteniendo una variable fija (tal como x en la figura 5.2), integrando con los 
valores de la otra variable localizados a lo largo de la línea recta que pasa a través de la 
variable fija y finalmente integrando todos los valores posibles de la variable fija. Así pues 


f(x, y) dy dx = f(x, y) dy dx = \ j 24 xy dy dx 

J -oo J ^o ‘ " J D J ' ' J 0 [ J 0 

fl 24.v j— y ^}dx=C 12x(l -xfdx 
o [2 0 J J o 


= 1 


Para calcular la probabilidad de que los dos tipos de nueces conformen cuando mucho 50% 
de la lata, Sea A = {(r,j):0^t^ 1, 0 s y < 1, y x + y < 0.5}, como se muestra en la 
figura 5.3. Entonces 


r r r0.5r0.5 X 

P((X, Y) GE A) = f(x, y) dx dy = 24xv dy dx = 0. 

J aJ ' • ' j o J o 


= 0.0625 


La función de densidad de probabilidad marginal de las almendras se obtiene manteniendo 
X fija en x e integrando la función de densidad de probabilidad conjunta f(x, y) a lo largo de 
la línea vertical que pasa por x: 


fx(x ) = [ /<X y) dy 

J —00 


A-X 


24xy dy = 12x(l — x) 2 

0 


0 <x< 1 

de lo contrario 



Figura 5.3 Calcule de P[(X, Y) £ 4] para el ejemplo 5.5. 

Por simetría de /(x, y) y la región D, la función de densidad de probabilidad marginal de Y 
se obtiene reemplazando x y X en f x (x) por y y Y, respectivamente. ■ 


Variables aleatorias independientes 

En muchas situaciones, la información sobre el valor observado de una de las dos variables 
A y E da información sobre el valor de la otra variable. En el ejemplo 5.1, la probabilidad 
marginal de X con x = 250 fue de 0.5, como lo fue la probabilidad de que X = 100. Sin 
embargo, si se sabe que el individuo seleccionado tuvo Y = 0, entonces X = 100 es cuatro 
veces más probable que X = 250. Por lo tanto, existe dependencia entre las dos variables. 

























CAPITULO 5 Distribuciones de probabilidad conjunta y muestras aleatorias 


DEFINICIÓN 


Ejemplo 5.6 


Ejemplo 5.7 

(continuación 
del ejemplo 
5.5) 


Ejemplo 5.8 


En el capítulo 2, se señaló que una forma de definir la independencia de dos eventos 
es vía la condición de que P(A f~l B) = P(A) • P(B). A continuación se da una definición 
análoga de la independencia de dos variables aleatorias. 

Se dice que dos variables aleatorias X y Y son independientes si por cada par de valo¬ 
res x y y, 

p(x, y) = p x (x) ■ Py(y) cuando X y Y son discretas 
o (5.1) 

f(x, y) = f x (x) • f Y (y ) cuando X y Y son continuas 

Si (5.1) no se satisface con todos los pares (x, y), entonces se dice que X y Y son 

dependientes. 


La definición dice que dos variables son independientes si su función masa de probabili¬ 
dad conjunta o función de densidad de probabilidad conjunta es el producto de las dos 
funciones masa de probabilidad marginal o de las funciones de densidad de probabilidad 
marginal. 

En la situación de la agencia de seguros de los ejemplos 5.1 y 5.2, 

p(100, 100) = 0.10 =h (0.5)(0.25) = p x (100) • /? F (100) 

de modo que X y Y no son independientes. La independencia de X y Y requiere que toda 
entrada en la tabla de probabilidad conjunta sea el producto de las probabilidades margina¬ 
les que aparecen en la filas y columnas correspondientes. ■ 

Como/(i, y) tiene la forma de un producto, X y Y parecerían ser independientes. Sin embar¬ 
go, aunque f x { f) = //f) = -^,/(f, f) = 0 =f= de modo que las variables no son en rea¬ 

lidad independientes. Para que sean independientes f(x, y) debe tener la forma g(x) • h(y) y 
la región de densidad positiva debe ser un rectángulo con sus lados paralelos a los ejes de 
coordenadas. ■ 

La independencia de dos variables aleatorias es más útil cuando la descripción del expe¬ 
rimento en estudio sugiere que X y Y no tienen ningún efecto entre ellas. Entonces, una vez 
que las funciones masa de probabilidad y de densidad de probabilidad marginales han sido 
especificadas, la función masa de probabilidad conjunta o la función de densidad de probabi¬ 
lidad conjunta es simplemente el producto de dos funciones marginales. Se desprende que 

P(a < X < b, c < Y < d) = P(a < X < b) • P(c < Y < d) 

Suponga que las duraciones de dos componentes son independientes entre sí y que la distri¬ 
bución exponencial de la primera duración es con parámetro A¡, mientras que la distribu¬ 
ción exponencial de la segunda es X 2 con parámetro A 2 . Entonces la función de densidad de 
probabilidad conjunta es 

f(x 1 ,x 2 ) =f Xl (x ] ) -fxjíxj 

_ \k l e~ x ' M • \ 2 e~ klXl = A 1 A 2 e _AlJ:i_A2JC2 jq > 0, x 2 > 0 

0 de lo contrario 

Sean A¡ = 1/1000 y A 2 = 1/1200, de modo que las duraciones esperadas son 1000 y 1 200 horas, 
respectivamente. La probabilidad de que ambas duraciones sean de por lo menos 1500 horas es 

P(1500 < X¡, 1500 < X 2 ) = P(1500 < X r ) ■ P(1500 < X 2 ) 

= £-*,(1500) . £—A 2 (1500) 

= (0.2231X0.2865) = 0.0639 ■ 
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Más de dos variables aleatorias 

Para modelar el comportamiento conjunto de más de dos variables aleatorias, se amplía el 
concepto de una distribución conjunta de dos variables. 



DEFINICIÓN 


Si Xj, X,, . . . , X n son variables aleatorias discretas, la función masa de probabilidad 
conjunta de las variables es la función 

P(X], x 2 ,. . ., x n ) = P(X l = x,, X 2 = x 2 ,..., X n = x n ) 

Si las variables son continuas, la función de densidad de probabilidad conjunta de 
Xj, . . . , X n es la función/(x¡, x 2 , . . . , x„) de modo que para n intervalos cualesquiera 
[fl 1; éj,. . ., [a n , b n \, 

P{a x < Xj < b lt ..., a n < X n < b n ) = J ... i f(x t ,..., xj dx n .. . dx, 

a i 


En un experimento binomial, cada ensayo podría dar por resultado uno de sólo dos 
posibles resultados. Considérese ahora un experimento compuesto de n ensayos indepen¬ 
dientes e idénticos, en los que cada ensayo puede dar uno cualquiera de r posibles resulta¬ 
dos. Sea p l = P(resultado i en cualquier ensayo particular) y defínanse las variables 
aleatorias como X¡ = el número de ensayos que dan el resultado i(i — 1, . . . , r). Tal expe¬ 
rimento se llama experimento multinomial y la función masa de probabilidad conjunta de 
X l5 . . . , X r se llama distribución multinomial. Utilizando un argumento de conteo análo¬ 
go al utilizado al derivar la distribución binomial, la función masa de probabilidad conjun¬ 
ta de Xj, . . . , X r , se puede demostrar que es 


P(x 




(xj!)(x 2 !).(x r !) 

0 


P X P . Pf 


X,. = 0, 1,2,... , con Xj + ■ ■ ■ + x r = n 
de lo contrario 


El caso r = 2 da la distribución binomial, con X { = número de éxitos y X 2 = n — Xj = 
número de fallas. 


Ejemplo 5.9 Si se determina el alelo de cada una de diez secciones de un chícharo obtenidas indepen¬ 
dientemente y p l = P( AA), p 2 = P(Aa), p 2 = P(aa), X t = número de AA, X 2 = número de 
Aa y X 3 = número de aa, entonces la función masa de probabilidad multinomial para estas 
X ; es 

10! 

P(xi, x 2 , x 3 ) = (Vi!)Us , )(V:¡!) P 1 P 2 P 3 = 0, 1,. . . y xj + x 2 + x 3 = 10 

con p l = p 3 = 0.25, p 2 = 0.5. 

P(Xj = 2, X 2 = 5, X 3 = 3) = p( 2, 5, 3) 

10! 

= ^^(0.25) 2 (0.5) 5 (0.25) 3 = 0.0769 ■ 

Ejemplo 5.10 Cuando se utiliza cierto método para recolectar un volumen fijo de muestras de roca en una 
región, existen cuatro tipos de roca. Sean Xj, X 2 y X 3 la proporción por volumen de los tipos 
de roca 1, 2 y 3 en una muestra aleatoriamente seleccionada (la proporción del tipo de roca 
4 es 1 — Xj — X 2 — X 3 , de modo que una variable X 4 sería redundante). Si la función de 
densidad de probabilidad conjunta de X¡, X 2 , X 3 es 



/(Xj, x 2 , x 3 ) 


CjCjX 2 (1 — x 3 ) 

0 


O^Xj < l,0¿x n < l,0áx 3 s l,Xj +Xt +x 3 ^ 1 

de lo contrario 
























CAPITULO 5 Distribuciones de probabilidad conjunta y muestras aleatorias 


DEFINICIÓN 


Ejemplo 5.11 


entonces k se determina como sigue 


1 = 


00 ,.00 fCO 

f(x x , x 2 , x 3 ) dx 3 dx 2 dx x 


—00 —00 —00 


oro 


X 1 

■ r 1 -*!—x 2 

' 


kx ,x 2 (l — x 3 ) dx 3 

dx 2 


_ 0 



dx x 


El valor de la integral iterada es kl 144, por lo tanto k = 144. La probabilidad de que las rocas 
de los tipos 1 y 2 integren más de 50% de la muestra es 


P(X¡ + X 2 < 0.5) = JJJ f(x i, x 2 , x 3 ) dx 3 dx 2 dx x 


I 0==*==1 para i'= 1, 2, 3 1 
(*+*+*£1, *+*^0.5] 

0.5 r rO.5—xir rl— xi— xi 


rU.JÍrU.D— Xi r 

J r\ I J n J ¡ 


'o Lo 

= 0.6066 


144jc 1 x 2 (1 — x 3 ) dx 3 


dx 2 l dx j 


La noción de independencia de más de dos variables aleatorias es similar a la noción 
de independencia de más de dos eventos. 


Se dice que las variables aleatorias Aj, X 2 , . . . ,X n son independientes si para cada 
subconjunto X i ,X¡, , X¡ de las variables (cada par, cada tripleta, y así sucesiva¬ 
mente), la función masa de probabilidad conjunta o función de densidad de probabi¬ 
lidad conjunta del subconjunto es igual al producto de funciones masa de probabilidad 
o funciones de densidad de probabilidad marginales. 


Así pues si las variables son independientes con n = 4, entonces la función masa de proba¬ 
bilidad conjunta o función de densidad de probabilidad conjunta de dos variables cuales¬ 
quiera es el producto de las dos marginales y asimismo para tres variables cualesquiera y 
las cuatro variables juntas. Aún más importante, una vez que se dice que n variables son 
independientes, entonces la función masa de probabilidad conjunta o función de densidad 
de probabilidad conjunta es el producto de las n marginales. 

Si X x , . . . , X n representan las duraciones de n componentes y éstos operan de manera inde¬ 
pendiente uno de otro y cada duración está exponencialmente distribuida con parámetro A, 
entonces 


/(*i> x 2 ,..., x„) 


(Áe A;tl ) • (Ae ÁXl ) .(Ae ÁXn ) 

jAíig-AZn 3l >0,x¡s0,...,jt„s0 

0 de lo contrario 


Si estos n componentes constituyen un sistema que fallará en cuanto un solo componente lo 
haga, entonces la probabilidad de que el sistema dure más allá del tiempo t es 


-QO -oo 

P(X x > t, . . . , X n > t) = J ■ ■ ■ J /(*!, ■ . . , X n ) dx x . . . dx n 
= í I, Áe- Áx ‘ dx\ ■ • • ^ \e~ kXn dx n 


— A tyi — g—rikt 


Por consiguiente, 


Ptduración del sistema < t) = 1 — e " Aí con t > 0 
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DEFINICIÓN 


O 


Ejemplo 5.12 
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lo que demuestra que la distribución de la duración del sistema es exponencial con paráme¬ 
tro «A; el valor esperado de la duración del sistema es 1/nA. ■ 

En muchas situaciones exponenciales que se considerarán en este libro, la indepen¬ 
dencia es una suposición razonable, de modo que la especificación de la distribución con¬ 
junta se reduce a decidir sobre distribuciones marginales apropiadas. 

Distribuciones condicionales 

Suponga X = el número de defectos mayores en un automóvil nuevo seleccionado al azar y 
Y = el número de defectos menores en el mismo auto. Si se sabe que el carro seleccionado 
tiene un defecto mayor, ¿cuál es ahora la probabilidad de que el carro tenga cuando mucho 
tres defectos menores?, es decir, ¿cuál es P(Y < 3 | X = 1)? Asimismo, si X y Y denotan las 
duraciones de los neumáticos delantero y trasero de una motocicleta y sucede que X = 10 000 
millas, ¿cuál es ahora la probabilidad de que Y sea cuando mucho de 15 000 millas y cuál es 
la duración esperada del neumático trasero “condicionada en” este valor de XI Preguntas de 
esta clase pueden ser respondidas estudiando distribuciones de probabilidad condicional. 


Sean X y Y dos variables aleatorias continuas con función de densidad de probabili¬ 
dad conjunta/(x, y) y función de densidad de probabilidad marginal Xf x ix). Entonces 
para cualquier valor x de X con el cual f x (x) > 0, la función de densidad de proba¬ 
bilidad condicional de Y dado que X = x es 

U\Á y I x) = -°o < y < °° 

Si X y Y son discretas, si en esta definición se reemplazan las funciones de densidad 
de probabilidad por funciones masa de probabilidad en esta definición da la función 
masa de probabilidad condicional de Y cuando X = x. 


Obsérvese que la definición de f Y i x (y \ x ) es igual a la de Pili | A), la probabilidad condi¬ 
cional de que B ocurra, dado que A ha ocurrido. Una vez que la función de densidad de pro¬ 
babilidad o la función masa de probabilidad ha sido determinada, preguntas del tipo 
planteado al principio de esta subsección pueden ser respondidas integrando o sumando a 
lo largo de un conjunto apropiado de valores Y. 


Reconsidere la situación del ejemplo 5.3 y 5.4 que implica X = la proporción del tiempo que 
la ventanilla para automovilista de un banco está ocupada y Y = la proporción análoga de ven¬ 
tanilla normal. La función de densidad de probabilidad condicional de Y dado que X = 0.8 es 


fy\Áy | 0 . 8 ) 


/(0-8, y) = + 1.2(0.8 + y 2 ) 

/ x (0.8) 1.2(0.8) + 0.4 


^(24 + 30y 2 ) 


0 < y < 1 


La probabilidad de que la ventanilla normal esté ocupada cuando mucho la mitad del tiem¬ 
po dado que X = 0.8 es entonces 

E(F< 0.5 \X = 0.8) = f°' 5 /r|x(y | 0.8) dy = f 24 + 30y 2 ) dy = 0.390 

■' -oo 1 J o 34 


Utilizando la función de densidad de probabilidad marginal de Y se obtiene P( Y < 0.5) = 
0.350. Además E(Y) = 0.6, mientras que la proporción esperada del tiempo que la ventani¬ 
lla normal está ocupada dado que X = 0.8 (una expectativa condicional) es 

E(Y\X= 0.8) = í y -f Y Uy | 0.8) dy = y(24 + 30y 2 ) dy = 0.574 

•'-oo 1 j o 
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EJERCICIOS Sección 5.1 (1-21) 


1. Una gasolinería cuenta tanto con islas de autoservicio como de 
servicio completo. En cada isla, hay una sola bomba de gaso¬ 
lina sin plomo regular con dos mangueras. Sea X el número de 
mangueras utilizadas en la isla de autoservicio y en un tiempo 
particular y sea F el número de mangueras en uso en la isla de 
servicio completo en ese tiempo. La función masa de probabi¬ 
lidad conjunta de X y Y aparece en la tabla adjunta. 


y 


p(x, y) 

0 

1 

2 


0 

0.10 

0.04 

0.02 

X 

i 

0.08 

0.20 

0.06 


2 

0.06 

0.14 

0.30 


a. ¿Cuál es P(X = 1 y Y = 1)? 

b. Calcule P{X £ 1 y F< 1). 

c. Describa el evento (X ¥= 0 y Y ¥= 0) y calcule su proba¬ 
bilidad. 

d. Calcule la función masa de probabilidad marginal de X 
y Y. Utilizando p x (x), ¿cuál es P(X < 1)? 

e. ¿Son X y Y variables aleatorias independientes? Explique. 

2. Cuando un automóvil es detenido por una patrulla de segu¬ 
ridad, cada uno de los neumáticos es revisado en cuanto a 
desgaste y cada uno de los faros es revisado para ver si está 
apropiadamente alineado. Sean X el número de faros que 
necesitan ajuste y Y el número de neumáticos defectuosos. 

a. Si X y Y son independientes con p x { 0) = 0.5, p x (l) — 0.3, 
P X ( 2) = 0.2 y p Y ( 0) = 0.6, p y (l) = 0.1, p r (2) = p Y ( 3) = 
0.05, p Y { 4) = 0.2, muestre la función masa de probabi¬ 
lidad conjunta de ( X , Y) en una tabla de probabilidad 
conjunta. 

b. Calcule P(X < 1 y Y < 1) con la tabla de probabilidad 
conjunta y verifique que es igual al producto P(X £ 1)’ 
P(Y < 1). 

c. ¿Cuál es P(X + Y = 0) (la probabilidad de ninguna vio¬ 
lación)? 

d. Calcule P(X + F< 1). 

3. Un supermercado cuenta tanto con una caja rápida como 
con una superrápida. Sea X¡ el número de clientes formados 
en la caja rápida a una hora particular del día y sea X 2 el 
número de clientes formados en la caja superrápida a la 
misma hora. Suponga que la función masa de probabilidad 
de X¡ y X 2 es la que aparece en la tabla adjunta. 



0 

1 

2 

3 

0 

0.08 

0.07 

0.04 

0.00 

1 

0.06 

0.15 

0.05 

0.04 

x¡ 2 

0.05 

0.04 

0.10 

0.06 

3 

0.00 

0.03 

0.04 

0.07 

4 

0.00 

0.01 

0.05 

0.06 


a. ¿Cuál es P{X l = 1, X 2 = 1), es decir, la probabilidad de 
que haya exactamente un cliente en cada caja? 

b. ¿Cuál es P(X l = X 2 ), es decir, la probabilidad de que los 
números de clientes en las dos cajas sean idénticos? 

c. Sea A el evento en que hay por lo menos dos clientes 
más en una caja que en la otra. Exprese A en función de 
X¡ y X 2 y calcule la probabilidad de este evento. 


d. ¿Cuál es la probabilidad de que el número total de clien¬ 
tes en las dos líneas sea exactamente cuatro? ¿Por lo 
menos cuatro? 

4. Regrese a la situación descrita en el ejercicio 3. 

a. Determine la función masa de probabilidad marginal de 
X t y enseguida calcule el número esperado de clientes 
formados en la caja rápida. 

b. Determine la función masa de probabilidad marginal 
de X 2 . 

c. Por inspección de las probabilidades P(X l — 4), P(X 2 = 0) 
y P(X ¡ = 4, X-, = 0), ¿son X l y X 2 variables aleatorias 
independientes? Explique. 

5. El número de clientes que esperan en el servicio de envoltu¬ 
ra de regalos en una tienda de departamentos es una variable 
aleatoria X con valores posibles 0, 1, 2, 3, 4 y probabilidades 
correspondientes 0.1, 0.2, 0.3, 0.25, 0.15. Un cliente selec¬ 
cionado al azar tendrá 1, 2 ó 3 paquetes para envoltura con 
probabilidades de 0.6, 0.3 y 0.1, respectivamente. Sea F = el 
número total de paquetes que van a ser envueltos para los 
clientes que esperan formados en la fila (suponga que el 
número de paquetes entregado por un cliente es indepen¬ 
diente del número entregado por cualquier otro cliente). 

a. Determine P(X = 3, F = 3), es decir, p(3, 3). 

b. Determine p(4, 11) 


6. Sea X el número de cámaras digitales Canon vendidas 
durante una semana particular por una tienda. La función 
masa de probabilidad de X es 


X 

0 

1 

2 

3 

4 

Px( X ) 

0.1 

0.2 

0.3 

0.25 

0.15 


El 60% de todos los clientes que compran estas cámaras 
también compran una garantía extendida. Sea F el número 
de compradores durante esta semana que compran una 
garantía extendida. 

a. ¿Cuál es P(X = 4, F = 2)1 [Sugerencia : Esta probabili¬ 
dad es igual a P(Y — 2\X = 4) • P(X = 4); ahora piense 
en las cuatro compras como cuatro ensayos de un expe¬ 
rimento binomial, con el éxito en un ensayo correspon¬ 
diente a comprar una garantía extendida.] 

b. Calcule P(X = Y). 

c. Determine la función masa de probabilidad conjunta de 
X y Y y luego la función masa de probabilidad marginal 
de F. 

7. La distribución de probabilidad conjunta del número X de 
carros y el número F de autobuses por ciclo de señal en un 
carril de vuelta a la izquierda propuesto se muestra en la 
tabla de probabilidad conjunta anexa. 


y 


p(x, y) 

0 

1 

2 


0 

0.025 

0.015 

0.010 


i 

0.050 

0.030 

0.020 


2 

0.125 

0.075 

0.050 

X 

3 

0.150 

0.090 

0.060 


4 

0.100 

0.060 

0.040 


5 

0.050 

0.030 

0.020 
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a. ¿Cuál es la probabilidad de que haya exactamente un 
carro y exactamente un autobús durante un ciclo? 

b. ¿Cuál es la probabilidad de que haya cuando mucho 
un carro y cuando mucho un autobús durante un ciclo? 

c. ¿Cuál es la probabilidad de que haya exactamente un 
carro durante un ciclo? ¿Exactamente un autobús? 

d. Suponga que el carril de vuelta a la izquierda tiene una 
capacidad de cinco carros y un autobús que equivale a 
tres carros. ¿Cuál es la probabilidad de un exceso de 
vehículos durante un ciclo? 

e. ¿Son A y Y variables aleatorias independientes? Explique. 

8. Un almacén cuenta con 30 componentes de un tipo, de los cua¬ 
les 8 fueron surtidos por el proveedor 1,10 por el proveedor 2 
y 12 por el proveedor 3. Seis de éstos tienen que ser seleccio¬ 
nados al azar para un ensamble particular. Sea X = el número 
de componentes del proveedor 1 seleccionados, Y = el núme¬ 
ro de componentes del proveedor 2 seleccionados y que p(x, y) 
denote la función masa de probabilidad conjunta de X y Y. 

a. ¿Cuál es p{ 3, 2)? [ Sugerencia: La probabilidad de que 
cada muestra de tamaño 6 sea seleccionada es igual. Por 
consiguiente, p( 3, 2) = (número de resultados con X = 3 
y Y — 2)/(el número total de resultados). Ahora use la 
regla de producto de conteo para obtener el numerador y 
denominador.] 

b. Utilizando la lógica del inciso a), obtenga p{x , y). (Esto 
puede ser considerado como un muestreo con distribu¬ 
ción hipergeométrica multivariante sin reemplazo de una 
población finita compuesta de más de dos categorías.) 

9. Se supone que cada neumático delantero de un tipo particu¬ 
lar de vehículo está inflado a una presión de 26 lb/pulg 2 . 
Suponga que la presión de aire real en cada neumático es una 
variable aleatoria: X para el neumático derecho y Y para el 
izquierdo con función de densidad de probabilidad conjunta 

„ , K(x 2 + y 1 ) 20<x< 30, 20 < y < 30 

f(x, v) = 

0 de lo contrario 

a. ¿Cuál es el valor de A - ? 

b. ¿Cuál es la probabilidad de que ambos neumáticos estén 
inflados a menos presión? 

c. ¿Cuál es la probabilidad de que la diferencia en la pre¬ 
sión del aire entre los dos neumáticos sea de cuando 
mucho 2 lb/pulg 2 ? 

d. Determine la distribución (marginal) de la presión del 
aire en el neumático derecho. 

e. ¿Son Xy Y variables aleatorias independientes? 

10. Annie y Alvie acordaron encontrarse entre las 5:00 p.m. y las 
6:00 p.m. para cenar en un restaurante local de comida salu¬ 
dable. Sea X = la hora de llegada de Annie y Y = la hora de 
llegada de Alvie. Suponga que Xy Y son independientes con 
cada una distribuida uniformemente en el intervalo [5, 6]. 

a. ¿Cuál es la función de densidad de probabilidad conjun¬ 
ta de A y 7? 

b. ¿Cuál es la probabilidad de que ambos lleguen entre las 
5:15 y las 5:45? 

c. Si el primero en llegar espera sólo 10 min antes de irse a 
comer a otra parte, ¿cuál es la probabilidad de que cenen 
en el restaurante de comida saludable? [Sugerencia'. El 
evento de interés es A — {(x, y): I x — y I — |].] 

11. Dos profesores acaban de entregar los exámenes finales 
para su copia. Sea X el número de errores tipográficos en el 
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examen del primer profesor y Y el número de tales errores 
en el segundo examen. Suponga que X tiene una distribución 
de Poisson con parámetro A, que Y tiene una distribución de 
Poisson con parámetro 6 y que Xy Y son independientes. 

a. ¿Cuál es la función masa de probabilidad conjunta de X 
y y? 

b. ¿Cuál es la probabilidad de que se cometa cuando 
mucho un error en ambos exámenes combinados? 

c. Obtenga una expresión general para la probabilidad de que 
el número total de errores en los dos exámenes sea m (don¬ 
de m es un entero no negativo). [ Sugerencia: A = {(.v, y): 
x + y = m } = ](m, 0), (m — 1, 1), ... , (1, m — 1), 
(0, /«)}. Ahora sume la función masa de probabilidad con¬ 
junta a lo largo de (x, y) E Ay use el teorema binomial, el 
cual dice que 

Y ( m \a k b m - k = (a + b) m 
con cualquier a, b.] 

12. Dos componentes de una minicomputadora tienen la 
siguiente función de densidad de probabilidad conjunta de 
sus vidas útiles X y Y\ 

,, . ¡xe~ x(1+y ^ r>0yv20 

/( x, y) = 

0 de lo contrario 

a. ¿Cuál es la probabilidad de que la vida útil X del primer 
componente exceda de 3? 

b. ¿Cuáles son las funciones de densidad de probabilidad 
marginal de A y y? ¿Son las dos vidas útiles indepen¬ 
dientes? Explique. 

c. ¿Cuál es la probabilidad de que la vida útil de por lo 
menos un componente exceda de 3? 

13. Tiene dos focos para una lámpara particular. Sea A = la 
vida útil del primer foco y Y = la vida útil del segundo 
(ambas en miles de horas). Suponga que Ay Y son inde¬ 
pendientes y que cada una tiene una distribución exponen¬ 
cial con parámetro A = 1. 

a. ¿Cuál es la función de densidad de probabilidad conjun¬ 
ta de A y A? 

b. ¿Cuál es la probabilidad de que cada foco dure cuando 
mucho 1000 horas (es decir, A< lyA< 1)? 

c. ¿Cuál es la probabilidad de que la vida útil total de los 
dos focos sea cuando mucho de 2? [ Sugerencia : Trace 
una figura de la región A = {(*, y): x £: 0, y — 0, x + 
y ^2} antes de integrar.] 

d. ¿Cuál es la probabilidad de que la vida útil total esté 
entre 1 y 2? 

14. Suponga que tiene diez focos y que la vida útil de cada uno 
es independiente de la de los demás y que la distribución de 
cada vida útil es exponencial con parámetro A. 

a. ¿Cuál es la probabilidad de que los diez focos fallen 
antes del tiempo í? 

b. ¿Cuál es la probabilidad de que exactamente k de los 
diez focos fallen antes del tiempo í? 

c. Suponga que nueve de los focos tienen vidas útiles 
exponencialmente distribuidas con parámetro A y que el 
foco restante tiene una vida útil que está exponencial¬ 
mente distribuida con parámetro d (fue hecho por otro 
fabricante). ¿Cuál es la probabilidad de que exactamen¬ 
te cinco de los diez focos fallen antes del tiempo f? 
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15. Considere un sistema compuesto de tres componentes como 
se ilustra. El sistema continuará funcionando en tanto el pri¬ 
mer componente funcione y o el componente 2 o el compo¬ 
nente 3 funcione. Sean X v X, y X 3 las vidas útiles de los 
componentes 1, 2 y 3, respectivamente. Suponga que las X¡ 
son independientes una de otra y que cada X¡ tiene una dis¬ 
tribución exponencial con parámetro A. 



a. Sea Y la vida útil del sistema. Obtenga la función de dis¬ 
tribución acumulativa de Y y derívela para obtener la 
función de densidad de probabilidad. [Sugerencia: 
F(y) = P(F < y); exprese el evento [Y £ y] en función 
de uniones y/o intersecciones de los tres eventos [X 1 £ v}, 
(X 2 < y} y {X 3 < y}.] 

b. Calcule la vida útil esperada del sistema. 

16. a. Con f(x 1 , x 2 , x 3 ) del ejemplo 5.10, calcule la función de 

densidad marginal conjunta de X 3 y X 3 (integrando 
para x 2 ). 

b. ¿Cuál es la probabilidad de que las rocas de tipos 1 y 3 
constituyan cuando mucho 50% de la muestra? [Suge¬ 
rencia: Use el resultado del inciso a).] 

c. Calcule la función de densidad de probabilidad marginal 
de Xj [Sugerencia: Use el resultado del inciso a).] 

17. Un ecólogo desea seleccionar un punto adentro de una región 
de muestreo circular de acuerdo con una distribución unifor¬ 
me (en la práctica esto podría hacerse seleccionando primero 
una dirección y luego una distancia a partir del centro en esa 
dirección). Sea X = la coordenada x del punto seleccionado 
y Y — la coordenada y del punto seleccionado. Si el círculo 
tiene su centro en (0, 0) y su radio es R , entonces la función 
de densidad de probabilidad conjunta de X y Y es 


/(*, y) 


——r X 2 + V 2 £ R 2 

-itR- 

0 de lo contrario 


a. ¿Cuál es la probabilidad de que el punto seleccionado 
quede dentro de RI2 del centro de la región circular? 
[Sugerencia: Trace una figura de la región de densidad 
positiva D. Como f(x, y) es constante en D, el cálculo de 
probabilidad se reduce al cálculo de un área.] 

b. ¿Cuál es la probabilidad de que tanto X como Y difieran 
de 0 por cuando mucho R/27 

c. Responda el inciso b) con R/V2 reemplazando a R/2. 

d. ¿Cuál es la función de densidad de probabilidad margi¬ 
nal de X? ¿De F? ¿Son X y Y independientes? 


18. Remítase al ejercicio 1 y responda las siguientes preguntas: 

a. Dado que X = 1, determine la función masa de probabi¬ 
lidad condicional de Y, es decir, p Y \ x (0 | 1), p Y \ x (l | 1) y 
Py|x(2|D. 

b. Dado que dos mangueras están en uso en la isla de auto¬ 
servicio, ¿cuál es la función masa de probabilidad con¬ 
dicional del número de mangueras en uso en la isla de 
servicio completo? 

c. Use el resultado del inciso b) para calcular la probabili¬ 
dad condicional P(Y < l|X = 2). 

d. Dado que dos mangueras están en uso en la isla de 
servicio completo, ¿Cuál es la función masa de probabi¬ 
lidad condicional del número en uso en la isla de auto¬ 
servicio? 

19. La función de densidad de probabilidad conjunta de las pre¬ 
siones de los neumáticos delanteros derecho e izquierdo se 
da en el ejercicio 9. 

a. Determine la función de densidad de probabilidad con¬ 
dicional de Y dado que X = x y la función de densidad 
de probabilidad condicional de X dado que Y = y. 

b. Si la presión del neumático derecho es de 22 lb/pulg 2 , 
¿cuál es la probabilidad de que la presión del neumático 
izquierdo sea de por lo menos 25 lb/pulg 2 ? Compare con 
P(Y> 25). 

c. Si la presión del neumático derecho es de 22 lb/pulg 2 , 
¿cuál es la presión esperada en el neumático izquierdo y 
cuál es la desviación estándar de la presión en este neu¬ 
mático? 

20. Sean X 3 , X,, X 3 , X 4 , X 5 y X 6 los números de lunetas M&M 
azules, cafés, verdes, naranjas, rojas y amarillas, respectiva¬ 
mente, en una muestra de tamaño n. Entonces estas X¡ tie¬ 
nen una distribución multinomial. De acuerdo con el sitio 
web de M&M, las proporciones de colores son p 3 = 0.24, 
p 2 — 0.13, p 3 = 0.16, p 4 = 0.20, p 5 = 0.13 y p 6 = 0.14. 

a. Si n = 12, ¿cuál es la probabilidad de que haya exacta¬ 
mente dos lunetas M&M de cada color? 

b. Con n = 20, ¿cuál es la probabilidad de que haya cuan¬ 
do mucho cinco lunetas naranjas? [Sugerencia: Consi¬ 
dere la luneta naranja como un éxito y cualquier otro 
color como falla.] 

c. En una muestra de 20 lunetas M&M, ¿cuál es la proba¬ 
bilidad de que el número de lunetas azules, verdes o 
naranjas sea por lo menos 10? 

21. Sean X 3 , X 2 y X 3 las vidas útiles de los componentes 1, 2 y 
3 en un sistema de tres componentes. 

a. ¿Cómo definiría la función de densidad de probabilidad 
condicional de X 3 dado que X 3 = x¡ y X 2 = x,? 

b. ¿Cómo definiría la función de densidad de probabilidad 
conjunta condicional de X 2 y X 3 dado que X l = x{! 


5.2 Valores esperados, covarianza y correlación 


Previamente se vio que cualquier función h(X) de una sola variable aleatoria X es por sí 
misma una variable aleatoria. Sin embargo, para calcular E[h(X )], no fue necesario obtener 
la distribución de probabilidad de h(X): en cambio, E[h(X)] se calculó como un promedio 
ponderado de valores de h(x), donde la función de ponderación fue la función masa de pro¬ 
babilidad p{x) o la función de densidad de probabilidad f(x) de X. Se obtiene un resultado 
similar para una función h(X, Y) de dos variables aleatorias conjuntamente distribuidas. 
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PROPOSICIÓN 


Ejemplo 5.13 


e 


Ejemplo 5.14 
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Sean X y Y variables aleatorias conjuntamente distribuidas con función masa de pro¬ 
babilidad p(x, y) o función de densidad de probabilidad /(x, y) ya sea que las varia¬ 
bles sean discretas o continuas. Entonces el valor esperado de una función h(X, Y) 
denotada por E[h(X, 7)] o ¡x h(X Yl está dada por 


E[h(X, Y)\ = « 


E E h ( x > j) • p (*’ y ) 

x y 

rCC /• 00 

h(x, y) • f{x, y) dx dy 


— 00 —00 


Si X y Y son discretas 
Si X y Y son continuas 


Cinco amigos compraron boletos para un concierto. Si los boletos son para asientos 1-5 en 
una fila particular y los boletos se distribuyen al azar entre los cinco, ¿cuál es el número 
esperado de asientos que separen a cualquiera dos de los cinco? Sean X y Y los números de 
asiento del primer y segundo individuos, respectivamente. Los pares posibles (X, Y) son 
(1, 2), (1, 3), . . . , (5, 4) y la función masa de probabilidad conjunta de (X, Y) es 


P(x, y) 


I 

20 

0 


x = 1,. . ., 5; y = 1,.. ., 5; x + y 
de lo contrario 


El número de asientos que separan a los dos individuos es h(X, Y) = \X — Y\ — 1. La tabla 
adjunta da h(x, y) para cada par posible (x, y). 


x 


h(x, y ) 

1 

2 

3 

4 

5 


i 

— 

0 

1 

2 

3 


2 

0 

— 

0 

1 

2 

y 

3 

1 

0 

— 

0 

1 


4 

2 

1 

0 

— 

0 


5 

3 

2 

1 

0 

— 


Por lo tanto 

5 5 j 

E[h(X, y)] = h( - x ’ 7) • p(x y) = 2 2 (I x “ vI - !) • xx = i 

(x,y) x=ly=l /U 

x + y 


En el ejemplo 5.5, la función de densidad de probabilidad conjunta de la cantidad X de 
almendras y la cantidad de nueces de acajú en una lata de una Ib de nueces fue 

_ Í24xy 0£tí l,0Sj< 1, x + y < 1 
J X ’ y jo de lo contrario 

Si una Ib de almendras le cuesta a la compañía $1.00, una Ib de nuez de acajú le cuesta $1.50 
y una Ib de cacahuates le cuesta $0.50, entonces el costo total del contenido de una lata es 


h(X, Y) = (1)X + (1.5)y + (0.5)(1 - X - Y) = 0.5 + 0.5X + Y 


(puesto que 1 — X — Y del peso se compone de cacahuates). El costo esperado total es 

/•oo /-OO 

E[h(X, Y)] = J J h(x, y) -f(x, y) dx dy 


—OO—OO 

rl A-x 


0 J 0 


(0.5 + 0.5x + y) • 24xy dy dx = $1.10 


El método de calcular el valor esperado de una función h(X j, . . . , X n ) de n variables 
aleatorias es similar al de dos variables aleatorias. Si las X¡ son discretas, E[h(X j, ■ ■ ■ , 2í n )] 
es una suma de n dimensiones; si las X¡ son continuas, es una integral de n dimensiones. 
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Covarianza 

Cuando dos variables aleatorias X y Y no son independientes, con frecuencia es de interés 
valorar qué tan fuerte están relacionadas una con otra. 


DEFINICIÓN 


La covarianza entre dos variables aleatorias Xy Fes 

Cov(Z, Y) = 1 

i[(X - PL X )(Y - /Ay)] 


X E (* - /%)(>’ - Ey)p(x, y) Z, Y discretas 

x y 


fCC fQG 

\ (x — /JL x )(y — ix Y )f(x, y) dx dy X, Y continuas 





Es decir, como X — ¡i x y Y — ¡± Y son las desviaciones de las dos variables con respecto a 
sus valores medios, la covarianza es el producto esperado de las desviaciones. Obsérvese 
que C'ov(X X) = E[(X - ijl x ) 2 ] = V(X). 

La exposición razonada para la definición es como sigue. Suponga que X y Y tienen 
una fuerte relación positiva entre ellas, lo que significa que los valores grandes de X tienden a 
ocurrir con valores grandes de Y y los valores pequeños de X con los valores pequeños de 
Y. Entonces la mayor parte de la masa o densidad de probabilidad estará asociada con (x — 
¡i x ) y (y — I-l y ) 0 ambos positivos (tanto X como Y sobre sus respectivas medias) o ambos 
negativos, así que el producto (x — i¿ x )(y — /A y ) tenderá a ser positivo. Por tanto con una 
fuerte relación positiva, Cov(Z, Y) deberá ser bastante positiva. Con una fuerte relación 
negativa los signos de ( x — fi x ) y (y — /Ay) tenderán a ser opuestos, lo que da un producto nega¬ 
tivo. Por tanto con una fuerte relación negativa, Cov(Z, Y) deberá ser bastante negativa. Si 
Xyfno están fuertemente relacionadas, los productos positivo y negativo tenderán a eli¬ 
minarse entre sí, lo que da una covarianza de cerca de 0. La figura 5.4 ilustra las diferentes 
posibilidades. La covarianza depende tanto del conjunto de pares posibles como de las pro¬ 
babilidades. En la figura 5.4, las probabilidades podrían ser cambiadas sin que se altere el 
conjunto de pares posibles y esto podría cambiar drásticamente el valor de Cov(Z, Y). 


- 1 + 

1 

• • 

• • 

y 

- 1 + 

•• ! 

• • 


y 

1 

t 

• 1 • 

-..— 

• • 

••+ ¡ - 

fíy 

X 

• i • 

T* • 

1 • • 

+ 1- 

► X 

fXy 

• 1 • 

T • 
• *1 • 

i 


Px Px Px 

a) b) c) 


Figura 5.4 p(x,y) = 1/10 de cada uno de los diez pares correspondientes a los puntos indicados; a) cova¬ 
rianza positiva; b) covarianza negativa; c) covarianza cerca de cero. 



Ejemplo 5.15 


Las funciones masa de probabilidad conjunta y marginal de X = cantidad deducible sobre 
una póliza de automóvil y Y = cantidad deducible sobre póliza de propietario de casa en el 
ejemplo 5.1 fueron 


p(x, y) 

0 

100 

200 

Jt 

100 

250 

y 

0 

100 

200 

100 

0.20 

0.10 

0.20 

Px(x) 

0.5 

0.5 

p r (y ) 

0.25 

0.25 

0.5 


250 


0.05 0.15 0.30 
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de la cual ¡± x = YjXp x {x) = 175 y p Y = 125. Por consiguiente, 

Cov(X, Y) =YZ (x- 175)(y - 125)/**, y) 

(*, y) 

= (100 - 175)(0 - 125)(0.20) + ■ ■ • 

+ (250 - 175)(200 - 125)(0.30) 

= 1875 ■ 

La siguiente fórmula abreviada para Cov(X, Y) simplifica los cálculos. 


PROPOSICIÓN 


Cov(X, Y) = E(XY ) - ¡i x • t± Y 



De acuerdo con esta fórmula, no se requieren sustracciones intermedias; sólo al final de 
cálculo f± x • ¡¿y se resta de E(XY). La comprobación implica expandir (X — ¡± X )( Y — ¡x Y ) y 
luego considerar el valor esperado de cada término por separado. 

Ejemplo 5.16 

(continuación 
del ejemplo 
5.5) 


Las funciones de densidad de probabilidad conjunta y marginal de X = cantidad de almen¬ 
dras y Y = cantidad de nueces de acajú fueron 

Í24xy 0ár<l,0<y<l,r+ySl 
X ’ ^ |0 de lo contrario 


fx(x) 


12 x(l - x) 1 0 < x < 1 

0 de lo contrario 


con ffy) obtenida reemplazando x por y en f x (x). Es fácil verificar que ¡jl x = ¡x Y = y, y 

rr 

J 0 J 0 


r°° /-oo rl f-l—JC 

E(XY ) = xyf(x, y ) dx dy = xy • 2Axy dy dx 

J—nrJ—m Jr\ J n 


í l 2 

= 8 X 2 ( 1 — x) 3 dx = — 

J o 15 


Por lo tanto, Cov(X, Y) = jy — (|)(|) = ~ — Una covarianza negativa se consi¬ 

dera razonable en este caso porque más almendras contenidas en la lata implican menos 
nueces de acajú. ■ 


Pudiera parecer que la relación en el ejemplo de los seguros es bastante fuerte puesto 
que Cov(X, Y) = 1875, mientras que Cov(X, Y) = en el ejemplo de las nueces parece¬ 
ría implicar una relación bastante débil. Desafortunadamente, la covarianza tiene un serio 
defecto que hace imposible interpretar un valor calculado. En el ejemplo de los seguros, 
suponga que la cantidad deducible se expresó en centavos en lugar de dólares. Entonces 
1 00X reemplazaría a X, 100K reemplazaría a Y y la covarianza resultante sería Coví IOOA", 
100L) = (lOOXIOOjCovCX, Y) = 18 750 000. Si, por otra parte, la cantidad deducible se 
hubiera expresado en cientos de dólares, la covarianza calculada habría sido 
(0.01)(0.01)( 1875) = 0.1875. El defecto de la covarianza es que su valor calculado depen¬ 
de críticamente de las unidades de medición. De manera ideal, la selección de las unida¬ 
des no debe tener efecto en la medida de la fuerza de la relación. Esto se logra graduando 
a escala la covarianza. 




















CAPITULO 5 Distribuciones de probabilidad conjunta y muestras aleatorias 

Correlación 


DEFINICIÓN 


Ejemplo 5.17 


PROPOSICIÓN 


PROPOSICIÓN 


El coeficiente de correlación de X y Y, denotado por Corrí A - , Y), p XY o simplemente 
p, está definido por 

CovíA; Y) 


Es fácil verificar que en el escenario de los seguros del ejemplo 5.15, E(X 2 ) = 36250, cr| 
36 250 - (175) 2 = 5625, a x = 75, E(Y 2 ) = 22500, cr 2 = 6875, y o> = 82.92. Esto da 


1875 


(75X82.92) 


= 0.301 


La siguiente proposición muestra que p remedia el defecto de Cov(A", Y) y también 
sugiere cómo reconocer la existencia de una fuerte relación (lineal). 


1. Si a y c son ambas positivas o ambas negativas. 

Corrí «A" + b, cY + d) = Corrí AT Y) 

2. Para dos variables aleatorias cualesquiera X y Y, — 1 < Corrí A", Y) < 1. 


La proposición 1 dice precisamente que el coeficiente de correlación no se ve afectado por 
un cambio lineal en las unidades de medición (si, por ejemplo, X = temperatura en °C, 
entonces 9X/5 + 32 = temperatura en °F). De acuerdo con la proposición 2, la relación 
positiva más fuerte posible es puesta en evidencia por p = +1, en tanto que la relación nega¬ 
tiva más fuerte posible corresponde a p = — 1. La comprobación de la primera proposición 
se ilustra en el ejercicio 35, y la de la segunda aparece en el ejercicio suplementario 87 al final 
del capítulo. Para propósitos descriptivos, la relación se describirá como fuerte si |p| > 0.8, 
moderada si 0.5 < |p| < 0.8 y débil si |p| < 0.5. 

Si se considera que p(x, y) o f(x, y) prescribe un modelo matemático de cómo las dos 
variables numéricas X y Y están distribuidas en alguna población (estatura y peso, califica¬ 
ción SAT verbal y calificación SAT cuantitativa, etc.), entonces p es una característica o 
parámetro de población que mide cuán fuertemente X y Y están relacionadas en la pobla¬ 
ción. En el capítulo 12, se considerará tomar una muestra de pares (x ,, yj), ■ ■ ■ , >'„) de 

la población. El coeficiente de correlación muestral r se definirá y utilizará entonces para 
hacer inferencias con respecto a p. 

El coeficiente de correlación p no es en realidad una medida completamente general 
de la fuerza de una relación. 


1. Si X y Y son independientes, entonces p = 0, pero p = 0 no implica independencia. 

2. p = lo—1 si y sólo si Y = aX + b con algunos números ay b con a X 0. 


Esta proposición dice que p mide el grado de asociación lineal entre X y Y y sólo cuando 
las dos variables están perfectamente relacionadas de una manera lineal p será tan positivo 
o negativo como pueda ser. Un p menor que 1 en valor absoluto indica sólo que la relación 
no es completamente lineal, sino que aún puede haber una fuerte relación no lineal. Además, 























c5_pl84-226.qxd 


3/12/08 


4:08 M Page 201 




5.2 Valores esperados, covarlanza y correlación 201 

p = 0 no implica que X y Y son independientes, sino sólo que existe una ausencia comple¬ 
ta de relación lineal. Cuando p = 0, se dice que X y L no están correlacionadas. Dos varia¬ 
bles podrían estar no correlacionadas y no obstante ser altamente dependientes porque 
existe una fuerte relación no lineal, así que se debe tener cuidado de no concluir demasiado 
del hecho de que p = 0. 


Ejemplo 5.18 Sean X y Y variables aleatorias discretas con función masa de probabilidad conjunta 


P(x, y) 


\ (*, y) = (-4, 1), (4, -1), (2, 2), (-2, -2) 
0 de lo contrario 


Los puntos que reciben masa de probabilidad positiva están identificados en el sistema de 
coordenadas ( x , y) en la figura 5.5. Es evidente por la figura que el valor de X está com¬ 
pletamente determinado por el valor de Y y viceversa, de modo que las dos variables son 
completamente dependientes. Sin embargo, por simetría ¡± x = /jl y = 0 y E(XY ) = (- 4)4 + 
(-4)4 + (4)4 + (4)4 = 0, por tanto Cov(A, Y) = E(XY ) — ¡x x • pu Y = 0 y por consiguiente 
Pxy = 0. ¡Aunque hay una dependencia perfecta, también hay una ausencia completa de 
cualquier relación lineal! 



2 y 
1 -- 


I-1-1-b- 

-4 -3 -2 -1 


H-1-1-1 

12 3 4 


-1 -- 


-2 -L 


Figura 5.5 Población de pares del ejemplo 5.18. 


Un valor de p próximo a 1 no necesariamente implica que el incremento del valor de 
X hace que se incremente Y. Implica sólo que los valores grandes de X están asociados con 
valores grandes de Y. Por ejemplo, en la población de niños, el tamaño del vocabulario y el 
número de caries están bastante correlacionados positivamente, pero con certeza no es cier¬ 
to que las caries hagan que crezca el vocabulario. En cambio, los valores de estas dos varia¬ 
bles tienden a incrementarse conforme el valor de la edad, una tercera variable, se 
incrementa. Para niños de una edad fija, quizá existe una muy baja correlación entre el 
número de caries y el tamaño del vocabulario. En suma, asociación (una alta correlación) 
no es lo mismo que causa. 



EJERCICIOS Sección 5.2 (22-36) 


22. Un instructor aplicó un corto examen compuesto de dos par¬ 
tes. Para un estudiante seleccionado al azar, sea A = el núme¬ 
ro de puntos obtenidos en la primera parte y Y = el número 
de puntos obtenidos en la segunda parte. Suponga que la fun¬ 
ción masa de probabilidad conjunta de A y y se da en la tabla 
adjunta. 


y 


p(x, y) 

0 

5 

10 

15 


0 

0.02 

0.06 

0.02 

0.10 

X 

5 

0.04 

0.15 

0.20 

0.10 


10 

0.01 

0.15 

0.14 

0.01 


a. Si la calificación anotada en la libreta de calificaciones 
es el número total de puntos obtenidos en las dos partes, 
¿cuál es la calificación anotada esperada E{X + Y)1 

b. Si se anota la máxima de las dos calificaciones, ¿cuál es 
la calificación anotada esperada? 

23. La diferencia entre el número de clientes formados en la 
caja rápida y el número formado en la caja superrápida del 
ejercicio 3 es A¡ — A 2 . Calcule la diferencia esperada. 

24. Seis individuos, incluidos A y B, se sientan alrededor de una 
tabla circular de una forma completamente al azar. Suponga 
que los asientos están numerados 1, . . . , 6. Sea A = el 
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número de asiento de A y Y = el número de asiento de B. 
Si A envía un mensaje escrito alrededor de la mesa a B en 
la dirección en la cual están más cerca, ¿cuántos individuos 
(incluidos A y B) esperarían manipular el mensaje? 

25. Un topógrafo desea delimitar una región cuadrada con L de 
lado. Sin embargo, debido a un error de medición, delimita 
en cambio un rectángulo en el cual los lados norte-sur son 
de longitud X y los lados este-oeste son de longitud Y. 
Suponga que X y Y son independientes y que cada uno está 
uniformemente distribuido en el intervalo [L — A, L + A] 
(donde 0 < A < L). ¿Cuál es el área esperada del rectángu¬ 
lo resultante? 

26. Considere un pequeño transbordador que puede transportar 
carros y autobuses. La cuota para carros es de $3 y para 
autobuses es de $10. Sean X y Y el número de carros y auto¬ 
buses, respectivamente, transportados en un solo viaje. 
Suponga que la distribución conjunta de X y Y aparece en la 
tabla del ejercicio 7. Calcule el ingreso esperado en un solo 
viaje. 

27. Annie y Alvie quedaron de encontrarse para desayunar 
entre el mediodía (0:00 M.) y 1:00 p.m. Denote la hora de 


llegada de Annie por X, y la de Alvie por Y y suponga que 

X y y son independientes con funciones de densidad de pro- 

b. 

habilidad 




fÁx) = | 

3x 2 

0 1 

de lo contrario 

35. a. 

. 0 

b. 



f Y (y ) = < 

Í2y 

0 <y < 1 


lo 

de lo contrario 


¿Cuál es la cantidad esperada de tiempo que el que llega 

c. 


primero debe esperar a la otra persona? [ Sugerencia: h(X, 
Y) = \X- Y\.] 


28. Demuestre que si X y Y son variables aleatorias indepen¬ 
dientes, entonces E(XY) = E(X ) • E{Y). Luego aplique esto 
en el ejercicio 25. [Sugerencia'. Considere el caso continuo 
con/(x, y) =f x (x) -f Y (y).] 

29. Calcule el coeficiente de correlación p, de X y Y del ejem¬ 
plo 5.16 (ya se calculó la covarianza). 

30. a. Calcule la covarianza de X y Y en el ejercicio 22. 
b. Calcule p para X y Y en el mismo ejercicio. 

31. a. Calcule la covarianza entre X y Y en el ejercicio 9. 
b. Calcule el coeficiente de correlación p para X y y. 

32. Reconsidere las vidas útiles de los componentes de mini¬ 
computadoras X y Y como se describe en el ejercicio 12. 
Determine E{XY). ¿Qué se puede decir sobre Cov(X, Y) y p? 

33. Use el resultado del ejercicio 28 para demostrar que cuan¬ 
do X y y son independientes Cov(X, Y) = Corr(X, Y) = 0. 

34. a. Recordando la definición de <x 2 para una sola variable 

aleatoria X, escriba una fórmula que sería apropiada para 
calcular la varianza de una función h(X, Y) de dos varia¬ 
bles aleatorias. [Sugerencia: Recuerde que la varianza es 
simplemente un valor especial esperado.] 

Use esta fórmula para calcular la varianza de la califica¬ 
ción anotada /¡(X, Y) [= máx(X, y)] en el inciso b) del 
ejercicio 22. 

Use las reglas de valor esperado para demostrar que 
Cov(aX + b, cY + d) = ac Cov(X, Y). 

Use el inciso a) junto con las reglas de varianza y desvia¬ 
ción estándar para demostrar que Corr(aX + b, cY + d) = 
Corr(X, y) cuando ay c tienen el mismo signo. 


+ 1 o —1. ¿En que condiciones será p = +1? 


O 


5.3 Estadísticos y sus distribuciones 


En el capítulo l,x 1 ,x 2 ,... ,x n denotaron las observaciones en una sola muestra. Considérese 
seleccionar dos muestras diferentes de tamaño n de la misma distribución de población. Las 
x¡ en la segunda muestra virtualmente siempre diferirán por lo menos un poco de aquellas en 
la primera muestra. Por ejemplo, una primera muestra de n = 3 carros de un tipo particular 
podría producir eficiencias de combustible x l = 30.7, x 2 = 29.4, x 3 = 31.1, mientras que 
una segunda muestra puede dar x¡ = 28.8, x 2 = 30.0 y x 3 = 31.1. Antes de obtener datos, 
existe incertidumbre sobre el valor de cada x¡. Debido a esta incertidumbre, antes de que los 
datos estén disponibles, cada observación se considera como una variable aleatoria y la 
muestra se denota por X,, X 2 , . ... X n (letras mayúsculas para variables aleatorias). 

Esta variación en los valores observados implica a su vez que el valor de cualquier 
función de las observaciones muéstrales, tal como la media muestral, la desviación estándar 
muestral o la dispersión de los cuartos muéstrales, también varía de una muestra a otra. Es 
decir, antes de obtener x { , , x n , existe incertidumbre en cuanto al valor de x, el valor de 

s, y así sucesivamente. 

Ejemplo 5.19 Suponga que la resistencia del material de un espécimen seleccionado al azar de un tipo 
particular tiene una distribución Weibull con valores de parámetro a = 2 (forma) y ¡3 = 5 
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5.3 Estadísticos y sus distribuciones 203 

(escala). La curva de densidad correspondiente se muestra en la figura 5.6. Fórmulas de la 
sección 4.5 dan 

¡i = E(X) = 4.4311 fl = 4.1628 a 2 = V(X) = 5.365 a = 2.316 
La media excede a la mediana debido a la asimetría positiva de la distribución. 


m 



Figura 5.6 Curva de densidad Weibull del ejemplo 5.19. 


Se utilizó MIN1TAB para generar seis muestras diferentes, cada una con n = 10, de 
esta distribución (resistencias de material de seis diferentes grupos de diez especímenes 
cada uno). Los resultados aparecen en la tabla 5.1, seguidos por los valores de la media, la 
mediana y la desviación estándar de cada muestra. Obsérvese en primer lugar que las diez 
observaciones en cualquier muestra particular son diferentes de aquellas en cualquier otra 
muestra. En segundo lugar, los seis valores de la media son diferentes entre sí, como lo son 
los seis valores de la mediana y los seis valores de la desviación estándar. Lo mismo es 
cierto para las medias 10% recortadas, la dispersiones de los cuartos de las muestras, y así 
sucesivamente. 


Tabla 5.1 Muestras de la distribución Weibull del ejemplo 5.19 


Muestra 

1 

2 

3 

4 

5 

6 

1 

6.1171 

5.07611 

3.46710 

1.55601 

3.12372 

8.93795 

2 

4.1600 

6.79279 

2.71938 

4.56941 

6.09685 

3.92487 

3 

3.1950 

4.43259 

5.88129 

4.79870 

3.41181 

8.76202 

4 

0.6694 

8.55752 

5.14915 

2.49759 

1.65409 

7.05569 

5 

1.8552 

6.82487 

4.99635 

2.33267 

2.29512 

2.30932 

6 

5.2316 

7.39958 

5.86887 

4.01295 

2.12583 

5.94195 

7 

2.7609 

2.14755 

6.05918 

9.08845 

3.20938 

6.74166 

8 

10.2185 

8.50628 

1.80119 

3.25728 

3.23209 

1.75468 

9 

5.2438 

5.49510 

4.21994 

3.70132 

6.84426 

4.91827 

10 

4.5590 

4.04525 

2.12934 

5.50134 

4.20694 

7.26081 

X 

4.401 

5.928 

4.229 

4.132 

3.620 

5.761 

X 

4.360 

6.144 

4.608 

3.857 

3.221 

6.342 

s 

2.642 

2.062 

1.611 

2.124 

1.678 

2.496 
























CAPITULO 5 Distribuciones de probabilidad conjunta y muestras aleatorias 


Además, el valor de la media de cualquier muestra puede ser considerada como esti¬ 
mación puntual (“puntual” porque es un solo número, correspondiente a un solo punto sobre 
la línea de numeración) de la media de la población p, cuyo valor se sabe que es 4.4311. 
Ninguna de las estimaciones de estas seis muestras es idéntica a la que se está estimando. 
Las estimaciones de la segunda y sexta muestras son demasiado grandes, en tanto que la 
quinta da una subestimación sustancial. Asimismo, la desviación estándar muestral da una 
estimación puntual de la desviación estándar de la población. Las seis estimaciones resul¬ 
tantes están equivocadas por lo menos en una pequeña cantidad. 

En resumen, los valores de cada una de las observaciones muéstrales varían de una 
muestra a otra, así que en general el valor de cualquier cantidad calculado a partir de los 
datos de la muestra, y el valor de una característica muestral utilizado como estimación de 
la característica poblacional correspondiente, prácticamente nunca coincidirá con lo que está 
siendo estimado. ■ 


DEFINICIÓN 


Un estadístico es cualquier cantidad cuyo valor puede ser calculado a partir de datos 
muéstrales. Antes de obtener los datos, existe incertidumbre sobre qué valor de cual¬ 
quier estadístico particular resultará. Por consiguiente, un estadístico es una variable 
aleatoria y será denotada por una letra mayúscula; se utiliza una letra minúscula para 
representar el valor calculado u observado del estadístico. 


Por lo tanto la media muestral, considerada como estadístico (antes de seleccionar una 
muestra o realizar un experimento), está denotada por X\ el valor calculado de este estadís¬ 
tico es x. Del mismo modo, S representa la desviación estándar muestral considerada como 
estadístico y su valor calculado es s. Si se seleccionan muestras de dos tipos diferentes 
de ladrillos y las resistencias a la compresión individuales se denotan por X v ... , X m y 
Y v ..., Y n , respectivamente, entonces el estadístico X — Y, la diferencia entre las dos resis¬ 
tencias muéstrales medias a la compresión, a menudo es de gran interés. 

Cualquier estadístico, por el hecho de ser una variable aleatoria, tiene una distribución 
de probabilidad. En particular, la media muestral X tiene una distribución de probabilidad. 
Supóngase, por ejemplo, que n = 2 componentes se seleccionan al azar y que el número de 
descomposturas mientras se encuentran dentro de garantía se determina para cada uno. Los 
valores posibles del número medio muestral de descomposturas X son 0 (si X l = X, = 0), 
0.5 (si o X x = 0 y X 2 = l_o A¡ = 1 y X 2 = 0), L 1.5, ... La distribución de probabilidad de 
X especifica P(X = 0), P(X = 0.5), y así sucesivamente, a partir de las cuales otras probabi¬ 
lidades tales como P( I < X < 3) y P(X > 2.5) pueden ser calculadas. Asimismo, si para una 
muestra de tamaño n = 2, los únicos valores posibles de la varianza muestral son 0, 12.5 y 
50 (el cual es el caso si X { y X 2 pueden tomar sólo los valores 40, 45 o 50), entonces la dis¬ 
tribución de probabilidad de S 2 da P(S 2 = 0), PiS 1 = 12.5) y P(S 2 = 50). La distribución de 
probabilidad de un estadístico en ocasiones se conoce como distribución de muestreo para 
enfatizar que describe cómo varía el valor del estadístico a través de todas las muestras que 
pudieran ser seleccionadas. 

Muestras aleatorias 

La distribución de probabilidad de cualquier estadístico particular depende no sólo de la dis¬ 
tribución de la población (normal, uniforme, etc.) y el tamaño de muestra n sino también del 
método de muestreo. Considérese seleccionar una muestra de tamaño n = 2 de una pobla¬ 
ción compuesta de sólo los tres valores 1, 5 y 10 y supóngase que el estadístico de interés 
es la varianza muestral. Si el muestreo se realiza “con reemplazo”, entonces S 2 = 0 resulta¬ 
rá si Aj = X 2 . Sin embargo, S 2 no puede ser igual a 0 si el muestreo se realiza “sin reem¬ 
plazo”. Por tanto PiS 2 = 0) = 0 con un método de muestreo, y esta probabilidad es positiva 
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con el otro método. La siguiente definición describe un método de muestreo encontrado a 
menudo (por lo menos aproximadamente) en la práctica. 


DEFINICIÓN 


Se dice que las variables aleatorias X v X 2 ,..., X n forman una muestra aleatoria sim¬ 
ple de tamaño n si 

1. Las X¡ son variables aleatorias independientes. 

2. Cada X¡ tiene la misma distribución de probabilidad. 



Las condiciones 1 y 2 pueden ser parafraseadas diciendo que las X¡ son independientes e 
idénticamente distribuidas (iid). Si el muestreo se realiza con reemplazo o de una población 
infinita (conceptual), las condiciones 1 y 2 se satisfacen con exactitud. Estas condiciones 
serán aproximadamente satisfechas si el muestreo se realiza sin reemplazo, aunque el tama¬ 
ño de la muestra sea mucho más pequeño que el tamaño de la población N. En la práctica, 
si n/N < 0.05 (cuando mucho 5% de la población se muestrea), se puede proceder como si 
las X i formarán una muestra aleatoria. La virtud de este método de muestreo es que la dis¬ 
tribución de probabilidad de cualquier estadístico es más fácil de obtener que con cualquier 
otro método de muestreo. 

Existen dos métodos generales de obtener información sobre una distribución de 
muestreo estadístico. Uno implica cálculos basados en reglas de probabilidad y el otro 
implica realizar un experimento de simulación. 

Derivación de una distribución de muestreo 

Se pueden utilizar reglas de probabilidad para obtener la distribución de un estadístico siem¬ 
pre que sea una función “bastante simple” de las X i y o existen relativamente pocos valores 
X diferentes en la población o bien la distribución de la población tiene una forma “accesi¬ 
ble”. Los dos ejemplos siguientes ilustran tales situaciones. 

Ejemplo 5.20 Un gran centro de servicio automotriz cobra $40, $45 y $50 por la afinación de carros de 
cuatro, seis y ocho cilindros, respectivamente. Si 20% de sus afinaciones se realizan en 
carros de cuatro cilindros, 30% en carros de seis cilindros y 50% en carros de ocho cilin¬ 
dros, entonces la distribución de probabilidad de los ingresos por una afinación selecciona¬ 
da al azar está dada por 


X 

40 

45 

50 


p(x') 

0.2 

0.3 

0.5 

con fjL = 46.5, cr 2 = 15.25 


Suponga que en un día particular sólo se realizan dos trabajos de servicio que implican afi¬ 
naciones. Sea X { = el ingreso por la primera afinación y X 2 = el ingreso por la segunda. 
Suponga que X, y X 2 son independientes, cada una con la distribución de probabilidad mos¬ 
trada en (5.2) [de modo que X, y X 2 constituyen una muestra aleatoria de la distribución 
(5.2)]. La tabla 5.2 pone en lista pares posibles (x,, x 2 ), la probabilidad de cada uno [calcu¬ 
lado por medio de (5.2) y la suposición de independencia] y los valores x y s 2 resultantes. 
Ahora para obtener la distribución de probabilidad de X, el ingreso promedio muestral por 
afinación, se debe considerar cada valor posible de x y calcular su probabilidad. Por ejem¬ 
plo, x = 45 ocurre tres veces en la tabla con probabilidades 0.10, 0.09 y 0.10, por lo tanto 

pj( 45) = P(X = 45) = 0.10 + 0.09 + 0.10 = 0.29 

Asimismo 

p s l 50) = P(S 2 = 50) = P(X l = 40, X 2 = 50 o X, = 

= 0.10 + 0.10 = 0.20 



50, X 2 = 40) 
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Tabla 5.2 Resultados, probabilidades y valores 


de x y s 2 

en el ejemplo 5.20 



*i 

x 2 

P(x i, x 2 ) 

X 

s 2 

40 

40 

0.04 

40 

0 

40 

45 

0.06 

42.5 

12.5 

40 

50 

0.10 

45 

50 

45 

40 

0.06 

42.5 

12.5 

45 

45 

0.09 

45 

0 

45 

50 

0.15 

47.5 

12.5 

50 

40 

0.10 

45 

50 

50 

45 

0.15 

47.5 

12.5 

50 

50 

0.25 

50 

0 


Las distribuciones de muestreo completas de X y S 2 aparecen en (5.3) y (5.4). 


X 

40 

42.5 

45 

47.5 

50 

Px(x 1 

0.04 

0.12 

0.29 

0.30 

0.25 


s 2 

0 

12.5 

50 

PsÁs 1 ) 

0.38 

0.42 

0.20 


(5.3) 

(5.4) 



La figura 5.7 ilustra un histograma de probabilidad tanto de la distribución original (5.2) 
como la distribución X (5.3). La figura sugiere primero que la media (valor esperado) de la 
distribución X es igual a la media 46.5 de la distribución original, puesto que ambos histo- 
gramas parecen estar centrados en el mismo lugar. 


0.5 


0.2 

1 

0.3 

1 

1 

0.04 

1 

0.12 

1 

0.29 

1 

0.30 

1 

0.25 

1 

40 

45 

50 

40 

42.5 

45 

47.5 

50 


Figura 5.7 Histogramas de probabilidad de la distribución subyacente y distribución X en el ejemplo 5.20. 


De acuerdo con (5.3), 

Hx = E{X) = ’Zxp^c) = (401(0.04) + ■ • • + (501(0.25) = 46.5 = p 

En segundo lugar, parece que la distribución X tiene una dispersión más pequeña (variabili¬ 
dad) que la distribución original, puesto que la masa de probabilidad se movió hacia la 
media. De nuevo de acuerdo con (5.3), 


°i = VQ .0 = X r 2 • Px(x) - p\ 


= (40) 2 (0.04) + 


= 7.625 = 


15.25 


• + (50) 2 (0.25) - (46.5) 2 

cr 2 
= ~2 


La varianza de X es precisamente la mitad de la varianza original (porque n = 2). 
El valor medio de S 2 es 


Ps 2 = ^(S 2 ) ='Zs 2 - p s is 2 ) 

= (0X0.38) + (12.5X0.42) + (50)(0.20) = 15.25 = a 2 
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Es decir, la distribución de muestreo X tiene su centro en la media de la población p y la 
distribución de muestreo S 2 está centrada en la varianza de la población a 2 . 

Si se hubieran realizado cuatro afinaciones en el día de interés, el ingreso promedio 
muestral X estaña basado en una muestra aleatoria de cuatro X¡, cada una con la distribución 
(5.2). Con más cálculos se obtiene la función masa de probabilidad de X con n = 4 como 


X 

40 

41.25 

42.5 

43.75 

45 

46.25 

47.5 

48.75 

50 

Px(x ) 

0.0016 

0.0096 

0.0376 

0.0936 

0.1761 

0.2340 

0.2350 

0.1500 

0.0625 


De acuerdo con esta, ¡jl^ = 46.50 =p y cr| = 3.8125 = cr 2 /4. La figura 5.8 es un histogra- 
ma de probabilidad de esta función masa de probabilidad. 



Figura 5.8 Histograma de probabilidad de X basado en el n = 4 en el ejemplo 5.20. 



El ejemplo 5.20 sugiere que el cálculo de p^(x) y /y(í 2 ) puede ser tedioso. Si la distri¬ 
bución original (5.2) hubiera permitido más de tres valores posibles, 40, 45 y 50, entonces 
incluso con n = 2 los cálculos hubieran sido más complicados. El ejemplo también sugiere, 
sin embargo, que existen algunas relaciones generales entre E{X), V(X), E(S 2 ), y la media p 
y la varianza a 2 de la distribución original. Estas se formulan en la siguiente sección. Ahora 
considérese un ejemplo en el cual la muestra aleatoria se extrae de una distribución continua. 

Ejemplo 5.21 Tiempo de servicio para un tipo de transacción bancaria es una variable aleatoria con dis¬ 
tribución exponencial y parámetro A. Suponga que X 1 y X 2 son tiempos de servicio para dos 
clientes diferentes, supuestos independientes entre sí. Considere el tiempo de servicio total 
T a = Zj + X-, para los dos clientes, también un estadístico. La función de distribución acumu¬ 
lativa de T a con t > 0, 

F r (t) = P(X j + X 2 < t) = JJ f(x¡, x 2 ) dx j dx 2 

{(* 1 , XÚ'-Xi+XÍ&t] 

= [ f \e~ Xx ' • \e~ Xx '- dx 2 dx l = í [\e~ Xx ' — Ae -Aí ] dx { 

Vo “ J o 

= 1 — e~ Af — A te~ u 

La región de integración se ilustra en la figura 5.9. 




Región de integración para obtener la función de distribución acumulativa de T 0 
en el ejemplo 5.21. 


Figura 5.9 








































CAPITULO 5 Distribuciones de probabilidad conjunta y muestras aleatorias 


La función de densidad de probabilidad de T a se obtiene derivando F To (t)\ 


fifi) 


ÍA 2 te kt í>0 

| 0 r<0 


(5.5) 


Esta es una función de densidad de probabilidad gama (a = 2 y ¡3 = 1/A). La función de 
densidad de probabilidad de X = TJ2 se obtiene a partir de la relación {X < i} si y sólo si 
{7) < 2x} como 




Í4A 2 xe 2kx x > 0 
j 0 x < 0 


(5.6) 


La media y la varianza de la distribución exponencial subyacente son jx = 1/A y cr 2 = 1/A 2 . 
Con las expresiones (5.5) y (5.6) se puede verificar que E(X ) = 1/A, V(X) = 1/(2A 2 ), E(T a ) = 
2/A, y V(T a ) = 2/A 2 . Estos resultados sugieren de nuevo algunas relaciones generales entre 
medias y varianzas de X, T a y la distribución subyacente. ■ 


Experimentos de simulación 

El segundo método de obtener información sobre distribución de muestreo estadístico es 
realizar un experimento de simulación. Este método casi siempre se utiliza cuando la obtención 
vía reglas de probabilidad es demasiado difícil o complicada de realizar. Tal experimento vir¬ 
tualmente siempre se realiza con la ayuda de una computadora. Las siguientes características 
de un experimento deben ser especificadas: 

1. El estadístico de interés (X, S, una media recortada particular, etcétera). 

2. La distribución de la población (normal con /a = 100 y (r = 15. uniforme con límite 
inferior A = 5 y superior B = 10, etcétera). 

3. El tamaño de muestra n( p. ej., n = 10 o n = 50). 

4. El número de réplicas k (p. ej., k = 500). 

Luego se utiliza una computadora para obtener k diferentes muestras aleatorias, cada una de 
tamaño n, de la distribución de población designada. Para cada una de las muestras, calcu¬ 
le el valor del estadístico y construya un histograma de los k valores calculados. Este histo- 
grama da la distribución de muestreo aproximada del estadístico. Mientras más grande es el 
valor de k, mejor tenderá a ser la aproximación (la distribución de muestreo real emerge a 
medida que k —» °°). En la práctica k = 500 o 1000 casi siempre es suficiente si el estadís¬ 
tico es “bastante simple”. 

Ejemplo 5.22 La distribución de la población del primer estudio de simulación es normal con ¡x = 8.25 y 
cr = 0.75, como se ilustra en la figura 5.10. [El artículo “Platelet Size in Myocardial 
Infarction” ( British Med. J., 1983: 449-451) sugiere esta distribución de volumen de pla¬ 
quetas en individuos sin historial clínico de problemas de corazón serios.] 



Figura 5.10 Distribución normal, con ¡x = 8.25 y cr = 0.75. 
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En realidad se realizaron cuatro experimentos diferentes, con 500 réplicas por cada uno. En 
el primero, se generaron 500 muestras de n = 5 observaciones cada una con MINITAB y 
los tamaños de las otras tres muestras fueron n = 10, n = 20 y n = 30, respectivamente. La 
media muestral se calculó para cada muestra y los histogramas resultantes de valores x apa¬ 
recen en la figura 5.11. 


Frecuencia Frecuencia 

relativa relativa 




a) b) 



Frecuencia Frecuencia 

relativa relativa 


0.25 

0.20 

0.15 

0.10 

0.05 



7.80 8.10 8.40 8.70 
7.95 8.25 8.55 
c) 



d) 


Figura 5.11 Histogramas muéstrales de x basados en 500 muestras, cada uno compuesto de n observa¬ 
ciones: a) n = 5; b) n = 10; c) n = 20; d) n = 30. 



Lo primero que se nota en relación con los histogramas es su forma. En cuanto a una 
razonable aproximación, cada uno de los cuatro se ve como una curva normal. El parecido 
sería aún más impactante si cada histograma se hubiera basado en más de 500 x valores. En 
segundo lugar, cada histograma está centrado aproximadamente en 8.25, la media de la 
población muestreada. Si los histogramas se hubieran basado en un secuencia interminable 
de valores x, sus centros habrían sido exactamente la media de la población, 8.25. 
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El aspecto final del histograma es su dispersión uno con respecto al otro. Mientras 
más pequeño es el valor de n, más grande es la extensión hacia la cual la distribución se 
esparce con respecto al valor medio. Por eso los histogramas con n = 20 y n = 30 están 
basados en intervalos de clase más angostos que aquellos de los dos tamaños de muestra 
más pequeños. Con los tamaños de muestra más grandes, la mayoría de los valores x están 
bastante cerca de 8.25. Este es el efecto de promediar. Cuando n es pequeño, un valor x 
inusual puede dar por resultado un valor x alejado del centro. Con un tamaño de muestra 
grande, cualesquiera valores x inusuales, cuando se promedian con los demás valores 
muéstrales, seguirá tendiendo a producir un valor x próximo a /u. Si se combinan estas 
ideas se obtiene un resultado muy apegado a su intuición: X basado en n grande tiende a 
acercarse más a /x que X basado en n pequeño. ■ 

Ejemplo 5.23 Considere un experimento de simulación en el cual la distribución de la población es bastan¬ 
te asimétrica. La figura 5.12 muestra la curva de densidad de las vidas útiles de un tipo de 
control electrónico [ésta es en realidad una distribución lognormal con E(ln(20) = 3 y 
V(ln(X)) = 0.16]. De nueva cuenta el estadístico de interés es la media muestral X. El experi¬ 
mento utilizó 500 réplicas y consideró los mismos cuatro tamaños de muestra que en el ejem¬ 
plo 5.22. Los histogramas resultantes junto con una curva de probabilidad normal generada 
por MINITAB con los 500 x valores basados en n = 30 se muestran en la figura 5.13. 






Figura 5.12 Curva de densidad del experimento de simulación del ejemplo 5.23 [F(X) = 21.7584, 
V(X) = 82.1449], 



A diferencia del caso normal, estos histogramas difieren en cuanto a forma. En particular, 
se vuelven progresivamente menos asimétricos a medida que el tamaño de muestra n se 
incrementa. El promedio de los 500 x valores con los cuatro tamaños de muestra diferentes 
se aproximan bastante al valor medio de la distribución de la población. Si cada histograma se 
hubiera basado en una secuencia interminable de valores 3c en lugar de sólo 500, los cuatro 
habrían tenido su centro en exactamente 21.7584. Por tanto los valores diferentes de n cam¬ 
bian la forma mas no el centro de la distribución de muestreo de X. La comparación de los 
cuatro histogramas en la figura 5.13 también muestra que conforme n se incrementa, la dis¬ 
persión de los histogramas decrece. El incremento de n produce un mayor grado de con¬ 
centración en torno al valor medio de la población y hace que el histograma se vea más 
como una curva normal. El histograma de la figura 5.13d) y la curva de probabilidad nor¬ 
mal en la figura 5.13e) proporcionan una evidencia convincente de que un tamaño de mues¬ 
tra de n = 30 es suficiente para superar la asimetría de la distribución de la población y para 
producir una distribución de muestreo X aproximadamente normal. 
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a) 

Densidad 




b) 


Densidad 



15 20 25 



Figura 5.13 Resultados del experimento de simulación del ejemplo 5.23: a) histograma dex con n = 5; b) histograma de 
x con n = 10; c) histograma de x con n = 20; d) histograma de x con n = 30; e) curva de probabilidad normal con 
n = 30 (generados por MINITAB). ■ 

























































































































c5_pl84-226.qxd 3/12/08 4:08 AM Page 212 



212 CAPÍTULO 5 Distribuciones de probabilidad conjunta y muestras aleatorias 

EJERCICIOS Sección 5.3 (37-45) 


37 . Una marca particular de jabón para lavadora de platos se 
vende en tres tamaños: 25 oz, 40 oz y 65 oz. El 20% de to¬ 
dos los compradores seleccionan la caja de 25 oz, 50% se¬ 
leccionan una caja de 40 oz y el 30% restante seleccionan 
la caja de 65 oz. Sean 30 y X 2 los tamaños de paquete selec¬ 
cionados por dos compradores independientemente seleccio¬ 
nados. 

a. Determine la distribución de muestreo de X, calcule 
E(X), y compare con p. 

b. Determine la distribución de muestreo de la varianza 
muestral S 2 , calcule ElS 1 ) y compare con a 2 . 

38 . Hay dos semáforos en mi camino al trabajo. Sea 30 el 
número de semáforos en los cuales me tengo que detener y 
suponga que la distribución 30 es como sigue: 


*1 

0 1 2 

p(x i) 

0.2 0.5 0.3 


Sea X 2 el número de semáforos en los cuales me tengo que 
detener camino a casa; X-, es independiente de 30. Suponga 
que X 2 tiene la misma distribución que 30, de modo que 30, 
X 2 es una muestra aleatoria de tamaño n = 2. 

a. Sea T a = X 1 + 30, y determine la distribución de proba¬ 
bilidad de T a . 

b. Calcule ¡jí t . ¿Cómo se relaciona con p, la media de la 
población? 

c. Calcule cr\. ¿Cómo se relaciona con a 2 , la varianza de 
la población? 

39 . Se sabe que 80% de todos los discos de almacenamiento 
extraíbles funcionan satisfactoriamente durante el periodo 
de garantía (son “éxitos”). Suponga que se seleccionan al 
azar n = 10 unidades de disco. Sea X = el número de éxi¬ 
tos en la muestra. El estadístico X/n es la proporción de la 
muestra (fracción) de éxitos. Obtenga la distribución mues¬ 
tral de este estadístico. [Sugerencia: Un posible valor de XIn 
es 0.3, correspondiente a X = 3. ¿Cuál es la probabilidad de 
este valor (qué clase de variable aleatoria es 30?] 

40 . Una caja contiene diez sobres sellados numerados 1, . . . , 
10. Los primeros cinco no contienen dinero, cada uno de los 
siguientes tres contiene $5 y hay un billete de $10 en cada 
uno de los últimos dos. Se selecciona un tamaño de mues¬ 
tra de 3 con reemplazo (así que se tiene una muestra alea¬ 
toria) y se obtiene la cantidad más grande en cualquiera de 
los sobres seleccionados. Si 30, 30 y 30 denotan las canti¬ 
dades en los sobres seleccionados, el estadístico de interés 
es M = el máximo de 30, 30 y 30. 

a. Obtenga la distribución de probabilidad de este estadís¬ 
tico. 

b. Describa cómo realizaría un experimento de simulación 
para comparar las distribuciones de M con varios tama¬ 
ños de muestra. ¿Cómo piensa que cambiaría la distri¬ 
bución a medida que n se incrementa? 

41 . Sea X el número de paquetes enviados por un cliente selec¬ 
cionado al azar vía una compañía de paquetería y mensaje¬ 
ría. Suponga que la distribución de X es como sigue: 


X 

1 

2 

3 

4 

p(x) 

0.4 

0.3 

0.2 

0.1 


a. Considere una muestra aleatoria de tamaño n = 2 (dos 
clientes) y sea X el número medio muestral de paquetes 
enviados. Obtenga la distribución de probabilidad de X. 

b. Remítase al inciso a) y calcule P(X £ 2.5). 

c. De nuevo considere una muestra aleatoria de tamaño 
n = 2, pero ahora enfóquese en el estadístico R = el ran¬ 
go muestral (diferencia entre los valores más grande y 
más pequeño en la muestra). Obtenga la distribución de 
R. [Sugerencia: Calcule el valor de R por cada resultado 
y use las probabilidades del inciso a).] 

d. Si se selecciona una muestra aleatoria de tamaño n = 4, 
¿Cuál es P(X £ 1.5)? [Sugerencia: No tiene que dar 
todos los resultados posibles, sólo aquellos para los cua¬ 
les x £ 1.5.] 

42 . Una compañía mantiene tres oficinas en una región, cada 
una manejada por dos empleados. Información concernien¬ 
te a salarios anuales (miles de dólares) es la siguiente: 

Oficina 1 1 2 2 3 3 

Empleado 1 2 3 4 5 6 

Salario 29.7 33.6 30.2 33.6 25.8 29.7 

a. Suponga que dos de estos empleados se seleccionan al 
azar de entre los seis (sin reemplazo). Determine la dis¬ 
tribución del salario medio muestral X. 

b. Suponga que se selecciona al azar una de las tres ofici¬ 
nas. Sean 30 y 30 los salarios de los_dos empleados. 
Determine la distribución muestral de X. 

c. ¿Cómo se compara E(X) de los incisos a) y b) con el 
salario medio de la población pl 

43 . Suponga que la cantidad de líquido despachado por una 
máquina está uniformemente distribuida con límite inferior 
A = 8 oz y límite superior B — 10 oz. Describa cómo rea¬ 
lizaría experimentos de simulación para comparar la distri¬ 
bución de la (muestra) dispersión de los cuartos con 
tamaños de muestra n = 5, 10, 20 y 30. 

44 . Realice un experimento con un programa de computadora 
estadístico u otro programa para estudiar la distribución 
muestral de X cuando la distribución de la población es 
Weibull con a = 2 y j3 = 5, como en el ejemplo 5.19. 
Considere los cuatro tamaños de muestra n = 5, 10, 20 y 30 
y en cada caso utilice 500 réplicas. ¿Con cuál de estos 
tamaños de muestra la distribución muestral X parece ser 
aproximadamente normal? 

45 . Realice un experimento de simulación con un programa de 
computadora estadístico u otro programa para estudiar 
la distribución muestral de X cuando la distribución de la 
población es lognormal con if(ln(30) = 3 y V(ln(3Q) = 1. 
Considere los cuatro tamaños de muestra n = 10, 20, 30 y 
50 y en cada caso utilice 500 réplicas. ¿Con cuál de estos 
tamaños de muestra la distribución muestral X parece ser 
aproximadamente normal? 
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5.4 Distribución de la media muestral 


La importancia de la medía muestral X proviene de su uso al sacar conclusiones sobre la 
media de la población ¡jl. Algunos de los procedimientos inferenciales más frecuentemen¬ 
te utilizados están basados en propiedades de la distribución muestral de X. Un examen 
previo de estas propiedades apareció en los cálculos y experimentos de simulación de la 
sección previa, donde se observaron las relaciones entre E{X) y ¡jl y también entre V(X), 
a 2 y n. 


PROPOSICIÓN 


Sean A¡, X 2 , . . . , X n una muestra aleatoria de una distribución con valor medio ¡jl y 
desviación estándar cr. Entonces 

1. E(X) = flx = M 

2. V(X) = cr\ = cr 2 /n y cr-j = o/Vñ 

Además, con T 0 = + ■ ■ ■ + X n (el total de la muestra), E(T 0 ) = n¡±, V(T 0 ) = ncr 2 y 

cr T ° = \fncr. 


Comprobaciones de estos resultados se difieren a la siguiente sección. De acuerdo con el 
resultado 1, la distribución (es decir, probabilidad) muestral de X está centrada precisamente 
en la media deja población de la cual se seleccionó la muestra. El resultado 2 muestra que 
la distribución X se concentra más en torno a /jl a medida que se incrementa el tamaño de la 
muestra n. En un marcado contraste, la distribución de T a se dispersa más a medida que n se 
incrementa. Al promediar la probabilidad se mueve hacia la parte media, en tanto que al tota¬ 
lizar la probabilidad se dispersa sobre un rango más y más amplio de valores. 

Ejemplo 5.24 En una prueba de fatiga por tensión con un espécimen de titanio, el número esperado de 
ciclos hasta la primera emisión acústica (utilizada para indicar la iniciación del agrieta¬ 
miento) es /i = 28 000 y la desviación estándar del número de ciclos es cr = 5000. Sean A¡, 
X 2 , . . . , X 25 una muestra aleatoria de tamaño 25, donde cada X¡ es el número de ciclos en 
un espécimen diferente seleccionado al azar. Entonces el valor esperado del número de 
ciclos medio muestral hasta la primera emisión es E(X) = ¡jl = 28000, y el número total 
esperado de ciclos para los 25 especímenes es E(T a ) = n¡i = 25(28000) = 700000. La des¬ 
viación estándar de X y T a son 


/— JUUU 

05 = a/Vñ = = 1000 

cr j = VW = V25(5000) = 25 000 

Si el tamaño de muestra se incrementa a n = 100, E(X) no cambió, pero rr ^ = 500, la mitad 
de su valor previo (el tamaño de muestra debe ser cuadruplicado al dividir a la mitad la des¬ 
viación estándar de X). ■ 

El caso de una distribución de población normal 

El experimento de simulación del ejemplo 5.22 indicó que cuando la distribución de la 
población es normal, cada histograma de valores x se representa muy bien con una curva 
normal. 
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PROPOSICIÓN 


Ejemplo 5.25 


Sean X x , X 2 , . . . , X n una muestra aleatoria de una distribución normal con media ¡i 
y desviación estándar cr. Entonces con cualquier n, X está normalmente distribuida 
(con media p, y desviación estándar cr/Vñ), al igual que T a (con media n/a y desvia¬ 
ción estándar Vñcr).* 


Se sabe todo lo que se tiene que saber sobre las distribuciones X y T 0 cuando la distribu¬ 
ción de la población es normal. En particular, las probabilidades de modo que P{a < X < b) 
y P(c < T a < d) se obtienen simplemente estandarizando. La figura 5.14 ilustra la pro¬ 
posición. 



Figura 5.14 Distribución de la población normal y distribuciones muéstrales X. 


El tiempo que requiere una rata de cierta subespecie seleccionada al azar para encontrar su 
camino a través de un laberinto es una variable aleatoria normalmente distribuida con /jl = 
1.5 min y cr = 0.35 min. Suponga que se seleccionan cinco ratas. Sean X v . .. ,X 5 sus tiem¬ 
pos en el laberinto. Suponiendo que las X¡ son una muestra aleatoria de esta distribución nor¬ 
mal, ¿cuál es la probabilidad de que el tiempo total T a = X 1 + • • • + X 5 de las cinco sea de 
entre 6 y 8 min? De acuerdo con la proposición, T a tiene una distribución normal con /i T = 
n/¿ = 5(1.5) = 7.5 y varianza cr\ = ncr 2 = 5(0.1225) = 0.6125, por tanto cr To = 0.783. Para 
estandarizar T a , reste ¡± T y divida entre cr T \ 


P( 6 < T a < 8) = P\ 


6 - 7.5 < < 8 - 7.5 

0.783 ~ ~ 0.783 

= P(-1.92 <Z< 0.64) = í>(0.64) - $(-1.92) = 0.7115 


La determinación de la probabilidad de que el tiempo promedio muestral X (una variable 
normalmente distribuida) sea cuando mucho de 2.0 min requiere ¡ 1 % = ¡i = 1.5 y crj = 
a/Vñ = 0.35/V5 = 0.1565. Entonces 


P(X 


2.0 ) = PZ< 


2.0 - 1.5 \ 
0.1565 j 


P(Z < 3.19) = $(3.19) = 0.9993 ■ 


Una comprobación del resultado para T a cuando n = 2 es posible si se utiliza el método del ejemplo 5.21, pero 
los detalles son complicados. El resultado general casi siempre se comprueba por medio de una herramienta teó¬ 
rica llamada función generadora de momentos. Se puede consultar una de las referencias del capítulo para más 
información. 
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Ejemplo 5.26 


Ejemplo 5.27 
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Teorema del límite central 

Cuando las X¡ están normalmente distribuidas, también lo está X con cada tamaño de mues¬ 
tra n. El experimento de simulación del ejemplo 5.23, sugiere que incluso cuando la distri¬ 
bución de la población es altamente no normal, el cálculo de promedios produce una 
distribución más acampanada que la que está siendo muestreada. Una conjetura razonable 
es que si n es grande, una curva normal apropiada representará de forma más o menos apro¬ 
ximada la distribución real de X. La proposición formal de este resultado es el teorema de 
probabilidad más importante. 


Teorema del límite central (TLC) 

Sean Tíj, X 2 , . . . , X n una muestra aleatoria de una distribución con media ¡± y varian- 
za a 2 . Entonces si n es suficientemente grande, X tiene aproximadamente una distri¬ 
bución normal con =¡± y crf = cr 2 /n, y T 0 también tiene aproximadamente una 
distribución normal con ¡i To = n/i, cr 2 T = ncr 2 . Mientras más grande es el valor de n, 
mejor es la aproximación. 


La figura 5.15 ilustra el teorema del límite central. De acuerdo con el TLC, cuando n es 
grande y se desea calcular una probabilidad tal como P{a < X < b), lo único que se requiere 
es “pretender” que X es normal, estandarizarla y utilizar la tabla normal. La respuesta resul¬ 
tante será aproximadamente correcta. Se podría obtener la respuesta correcta determinando 
primero la distribución de X así que el TLC proporciona un a tajo verdaderamente impre¬ 
sionante. La comprobación del teorema implica muchas matemáticas avanzadas. 

Distribución x con 
n grande (aproximadamente normal) 



Figura 5.15 Teorema del límite central ilustrado. 


La cantidad de una impureza particular en un lote de cierto producto químico es una varia¬ 
ble aleatoria con valor medio de 4.0 g y desviación estándar de 1.5 g. Si se preparan 50 lotes 
en forma independiente, ¿cuál es la probabilidad (aproximada) de que la cantidad prome¬ 
dio muestral de la impureza X sea de 3.5 a 3.8 g? De acuerdo con la regla empírica que se 
formulará en breve, n = 50 es suficientemente grande como para que el TLC sea aplicable. 
En ese caso X tiene aproximadamente una distribución normal con valor medio = 4.0 y 
crj = 1.5/V50 = 0.2121, por lo tanto 


P(3.5 < X < 3.8) » P\ 


3.5 - 4.0 < < 3.8 - 4.0 

0.2121 “ ~ 0.2121 
= $(-0.94) - $(-2.36) = 0.1645 


Una organización de protección al consumidor reporta cotidianamente el número de defectos 
mayores de cada automóvil nuevo que prueba. Suponga que el número de tales defectos en 
cierto modelo es una variable aleatoria con valor medio de 3.2 y desviación estándar de 2.4. 
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Entre 100 carros seleccionados al azar de este modelo, ¿qué tan probable es que el número 
promedio muestral de defectos mayores exceda de 4? Sea X¡ el número de defectos mayo¬ 
res del z-ésimo carro en la muestra aleatoria. Obsérvese que X¡ es una variable aleatoria dis¬ 
creta, pero el TLC es aplicable si la variable de interés es discreta o continua. Además, 
aunque el hecho de que la desviación estándar de esta variable no negativa es bastante 
grande con respecto al valor medio sugiere que su distribución es positivamente asimétrica, 
el gran tamaño de muestra implica que X sí tiene aproximadamente una distribución normal. 
Con ¡Jix= 3.2 y <75 = 0.24, 

P(X > 4) ~ PÍ Z > 4 \ = 1 - $(3.33) = 0.0004 ■ 

El TLC da una idea de por qué muchas variables aleatorias tienen distribuciones de 
probabilidad que son aproximadamente normales. Por ejemplo, el error de medición en un 
experimento científico puede ser considerado como la suma de varias perturbaciones y erro¬ 
res subyacentes de pequeña magnitud. 

Aunque la utilidad del TLC para inferencia pronto será evidente, el contenido intuitivo 
del resultado presenta muchas dificultades para los estudiantes novicios. De nuevo regresan¬ 
do a la figura 5.7, el histograma de probabilidad a la izquierda ilustra la distribución que se 
está muestreando. Es discreta y bastante asimétrica de modo que no se vea en absoluto como 
una distribución normal. La distribución de X con n = 2 comienza a exhibir algo de simetría 
y ésta incluso es más pronunciada con n . = 4 en la figura 5.8. La figura 5.16 contiene la dis¬ 
tribución de probabilidad X con n = 8, así como también un histograma de probabilidad de 
esta distribución. Con = p. = 46.5 y 05 = cr/Vzz = 3.905/V8 = 1.38, si se ajusta una cur¬ 
va normal con esta media y desviación estándar al histograma de X, el área de los rectángulos 
en el histograma de probabilidad son razonablemente bien aproximadas por las áreas de curva 
normal, por lo menos en la parte central de la distribución. La figura de T a es similar excepto 
que la escala horizontal está mucho más dispersa, con T a dentro de 320 (x = 40) a 400 Oc = 50). 


X 

40 

40.625 

41.25 

41.875 

42.5 

43.125 

p(x) 

0.0000 

0.0000 

0.0003 

0.0012 

0.0038 

0.0112 

X 

43.75 

44.375 

45 

45.625 

46.25 

46.875 

P(X) 

0.0274 

0.0556 

0.0954 

0.1378 

0.1704 

0.1746 

X 

47.5 

48.125 

48.75 

49.375 

50 


p(x) 

0.1474 

0.0998 

0.0519 

0.0188 

0.0039 



a) 




b) 


Figura 5.16 a) Distribución de probabilidad de X con n = 8; b) histograma de probabilidad y aproxi¬ 
mación normal a la distribución deX cuando la distribución original es como en el ejemplo 5.20. 
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Una dificultad práctica al aplicar el teorema del límite central es saber cuándo n es 
suficientemente grande. El problema es que la precisión de la aproximación con una n 
particular depende de la forma de la distribución subyacente original que está siendo 
muestreada. Si la distribución subyacente tiende a una curva de densidad normal, entonces 
la aproximación será buena incluso con n pequeña, mientras que si está lejos de ser normal, 
entonces se requerirá una n grande. 


Regla empírica 

Si n > 30, se puede utiliza el teorema del límite central. 


Existen distribuciones de población para las cuales una n de 40 o 50 no son suficientes, pero 
tales distribuciones rara vez se encuentran en la práctica. Por otra parte, la regla empírica a 
menudo es conservadora; para muchas distribuciones de población, una n mucho menor que 
30 serían suficientes. Por ejemplo, en el caso de una distribución de población uniforme, el 
teorema del límite central da una buena aproximación con n > 12. 

Otras aplicaciones del teorema del límite central 

El teorema del límite central puede ser utilizado para justificar la aproximación normal a 
la distribución binomial discutida en el capítulo 4. Recuérdese que una variable binomial X 
es el número de éxitos en una experiencia binomial compuesta de n ensayos independien¬ 
tes con éxitos/fallas y p = P(S) para cualquier ensayo particular. Defínanse nuevas varia¬ 
bles aleatorias X t , X 2 , . ... X n como 

_ 11 Si el í-ésimo ensayo produce un éxito _ 

' [0 Si el í-ésimo ensayo produce una falla ’’’’’ 

Como los ensayos son independientes y P(S) es constante de un ensayo a otro, las X¡ son 
idénticas (una muestra aleatoria de una distribución de Bernoulli). El teorema del límite cen¬ 
tral implica entonces que si n es suficientemente grande, tanto la suma como el promedio 
de las X¡ tienen distribuciones normales de manera aproximada. Cuando se suman las X¡, se 
agrega un 1 por cada S (éxito) que ocurra y un 0 por cada F (falla), por tanto X 1 + • • • + X n 
= X. La media muestral de las X¡ es X/n. la proporción muestral de éxitos. Es decir, tanto X 
como Xln son aproximadamente normales cuando n es grande. El tamaño de muestra nece¬ 
sario para esta aproximación depende del valor de p\ Cuando p se acerca a 0.5, la distribu¬ 
ción de cada X¡ es razonablemente simétrica (véase la figura 5.17), mientras que la 
distribución es bastante asimétrica cuando p se acerca a 0 o 1. Utilizando la aproximación 
sólo si tanto np > 10 como a n( 1 — p) > 10 garantiza que n es suficientemente grande para 
superar cualquier asimetría en la distribución de Bernoulli subyacente. 


0 1 0 1 

a) b) 

Figura 5.17 Dos distribuciones de Bernoulli: a) p 5 - 4 (razonablemente simétrica); b) p 5 - 1 (muy 
asimétrica). 

Recuérdese por la sección 4.5 que X tiene una distribución lognormal si \n(X) tiene 
una distribución normal. 


Sean X u X 2 . . ... X n una muestra aleatoria de una distribución para la cual sólo valo¬ 
res positivos son posibles [P(X¡ >0) = 1]. Entonces si n es suficientemente grande, 
el producto Y = X { X 2 . X n tiene aproximadamente una distribución lognormal. 
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Para verificar esto, obsérvese que 

ln(7) = ln(X,) + ln(X 2 ) + • • ■ + ln(X„) 

Como \n(Y) es una suma de variables aleatorias independientes y distribuidas de manera 
idéntica [las ln(X,-)], es aproximadamente normal cuando n es grande, así que Y tiene apro¬ 
ximadamente una distribución lognormal. Como ejemplo de la aplicabilidad de este resul¬ 
tado, Bury (Statistical Models in Applied Science, Wiley, p. 590) argumenta que el proceso 
de daños en el flujo plástico y en la propagación de grietas es un proceso multiplicativo, de 
modo que las variables tales como porcentaje de alargamiento y resistencia a la ruptura tie¬ 
nen aproximadamente distribuciones lognormales. 


EJERCICIOS Sección 5.4 (46-57) 


46 . El diámetro interno de un anillo de pistón seleccionado al 
azar es una variable aleatoria con valor medio de 12 cm y 
desviación estándar de 0.04 cm. 

a. Si X es el diámetro medio en una muestra aleatoria de 
n— 16 anillos, ¿dónde está centrada la distribución muestral 
de X y cuál es la desviación estándar de la distribución X? 

b. Responda las preguntas planteadas en el inciso a) con un 
tamaño de muestra de n = 64 anillos. 

c. ¿Con cuál de las dos muestras aleatorias, la del inciso a) 
o la del inciso b), es más probable que X esté dentro de 
0.01 cm de 12 cm? Explique su razonamiento. 

47 . Remítase al ejercicio 46. Suponga que el diámetro de la dis¬ 
tribución es normal. 

a. Calcule P(1 1.99 <X< 12.01) cuando n = 16. 

b. ¿Qué tan probable es que el diámetro medio muestral 
exceda de 12.01 cuando n = 25? 

48 . Sean Xj, X„ . . . , X 100 los pesos netos reales de 100 sacos 
de 50 Ib de fertilizante seleccionados al azar. 

a. Si el peso esperado de cada saco es de 50 Ib y la varian- 
za es uno, calcule P(49.9 £ X £ 50.1) (aproximada¬ 
mente) por medio del teorema del límite central. 

b. Si el peso esperado es de 49.8 Ib en lugar de 50 Ib de 
modo que en promedio los sacos están menos llenos, 
calcule R(49.9 <X< 50.1). 

49 . Hay 40 estudiantes en una clase de estadística elemental. 
Basado en años de experiencia, el instructor sabe que el 
tiempo requerido para calificar un primer examen seleccio¬ 
nado al azar es una variable aleatoria con un valor esperado 
de seis min y una desviación estándar de seis min. 

a. Si los tiempos de calificación son independientes y el 
instructor comienza a calificar a las 6:50 p.m. y califica 
en forma continua, ¿cuál es la probabilidad (aproxima¬ 
da) de que termine de calificar antes de que se inicie el 
programa de noticias de las 11:00 p.m.? 

b. Si el reporte de deportes se inicia a la 11:10, ¿cuál es 
la probabilidad de que se pierda una parte del reporte 
si se espera hasta que termine de calificar antes de 
prender la TV? 

50 . La resistencia a la ruptura de un remache tiene un valor 
medio de 10 000 lb/pulg 2 y una desviación estándar de 500 
lb/pulg 2 . 

a. ¿Cuál es la probabilidad de que la resistencia a la ruptu¬ 
ra media de una muestra aleatoria de 40 remaches sea de 
entre 9900 y 10 200? 


b. Si el tamaño de muestra hubiera sido de 15 y no de 40, 
¿se podría calcular la probabilidad solicitada en el inci¬ 
so a) con la información dada? 

51 . El tiempo requerido por un solicitante seleccionado al azar 
de una hipoteca para llenar un formulario tiene una distri¬ 
bución normal con valor medio de 10 min y desviación 
estándar de dos min. Si cinco individuos llenan un formula¬ 
rio en un día y seis en otro, ¿cuál es la probabilidad de que 
la cantidad promedio muestral de tiempo requerido cada día 
sea cuando mucho de 11 min? 

52 . La vida útil de un tipo de batería está normalmente distribuida 
con valor medio de 10 horas y desviación estándar de una hora. 
Hay cuatro baterías en un paquete. ¿Qué valor de vida útil es 
tal que la vida útil total de todas las baterías contenidas en un 
paquete exceda de ese valor en sólo 5% de todos los paquetes? 

53. Se sabe que la dureza Rockwell de “pernos” de un tipo tie¬ 
ne un valor medio de 50 y una desviación estándar de 1.2. 

a. Si la distribución es normal, ¿cuál es la probabilidad de 
que la dureza media de una muestra aleatoria de 9 per¬ 
nos sea por lo menos de 51 ? 

b. ¿Cuál es la probabilidad (aproximada) de que la dureza 
media de una muestra aleatoria de 40 pernos sea por lo 
menos de 51? 

54 . Suponga que la densidad de un sedimento (g/cm) de un 
espécimen seleccionado al azar de cierta región está nor¬ 
malmente distribuida con media de 2.65 y desviación están¬ 
dar de 0.85 (sugerida en “Modeling Sediment and Water 
Column Interactions for Hydrophobic Pollutants”, Water 
Research, 1984: 1169-1174). 

a. Si se selecciona una muestra aleatoria de 25 especíme¬ 
nes, ¿cuál es la probabilidad de que la densidad del sedi¬ 
mento promedio muestral sea cuando mucho de 3.00? 
¿De entre 2.65 y 3.00? 

b. ¿Qué tan grande debe ser un tamaño de muestra para 
garantizar que la primera probabilidad en el inciso a) sea 
por lo menos de 0.99? 

55 . El número de infracciones de estacionamiento aplicadas en 
una ciudad en cualquier día de la semana dado tiene una 
distribución de Poisson con parámetro A = 50. ¿Cuál es la 
probabilidad aproximada de que 

a. entre 35 y 70 infracciones sean aplicadas en un día par¬ 
ticular? [ Sugerencia: Cuando A es grande, una variable 
aleatoria de Poisson tiene aproximadamente una distri¬ 
bución normal.] 
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b. el número total de infracciones aplicadas durante una 
semana de 5 días sea de entre 225 y 275? 

56. Un canal de comunicación binaria transmite una secuencia 
de “bits” (ceros y unos). Suponga que por cualquier bit par¬ 
ticular transmitido, existe una probabilidad de 0.1 de que 
ocurra un error en la transmisión (un 0 se convierte en 1 o 
un 1 se convierte en 0). Suponga que los errores en los bits 
ocurren independientemente uno de otro. 

a. Considere transmitir 1000 bits. ¿Cuál es la probabilidad 
aproximada de que cuando mucho ocurran 125 errores 
de transmisión? 
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b. Suponga que el mismo mensaje de 1000 bits es enviado 
en dos momentos diferentes independientemente uno de 
otro? ¿Cuál es la probabilidad aproximada de que el 
número de errores en la primera transmisión sea dentro 
de 50 del número en la segunda? 

57. Suponga que la distribución del tiempo X (en horas) utili¬ 
zado por estudiantes en cierta universidad en un proyecto 
particular es gama con parámetros a = 50 y jS = 2. Como 
a es grande, se puede demostrar que X tiene aproximada¬ 
mente una distribución normal. Use este hecho para calcu¬ 
lar la probabilidad de que un estudiante seleccionado al azar 
utilice cuando mucho 125 horas en el proyecto. 


5.5 Distribución de una combinación lineal 


La media muestral X y el total muestral T a son casos especiales de un tipo de variable alea¬ 
toria que surgen con frecuencia en aplicaciones estadísticas. 


DEFINICIÓN 


Dado un conjunto de n variables aleatorias X¡,. . . , X n y n constantes numéricas 
a n , la variable aleatoria 

Y = a,X, + • • ■ + a n X rl = ¿ a I X ¡ (5.7) 

¿=l 

se llama combinación lineal de las X¡. 




Con a l = a 2 = • • ■ = a n = 1 se obtiene Y = X { + ■ -j_+ X n = T a , y tq = a 2 = ■ • • = a n = da 
Y = + ■ ■ ■ + jx n = j(X¡ + ■ ■ ■ + X n ) = \T 0 = X. Obsérvese que no se requiere que las 

X¡ sean independientes o que estén idénticamente distribuidas. Todas las X¡ podrían tener 
distribuciones diferentes y por consiguiente valores y varianzas medias diferentes. Primero 
se considera el valor y la varianza esperados de una combinación lineal. 


PROPOSICIÓN 


Si Xj, X 2 , . .., X n tienen valores medios ¿x,,. . . , ¡u n , respectivamente y varianzas <xj, 
. . . , al, respectivamente. 

1. Si las X¡ son independientes o no. 

EÍAiX) + a 2 X 2 + ■ ■ ■ + a n X n ) = a^E (Xj) + a 2 E(X 2 ) + • ■ ■ + a n E(X n ) 

= « 1 M 1 + • • ■ + a„A n (5.8) 

2. Si X 1; . . . , X n son independientes, 

V(a l X l + a 2 X 2 + ■■■ + a n X n ) = ajVÍXJ + a\V(X 2 ) + • ■ ■ + alV(X „) 

= a\a\ + ■ ■ ■ + a\a\ (5.9) 

y 

0‘ 0l x,+. ■ ■+«* = + ■ ■ ■ + alai (5.10) 

3. Con cualquiera X v , X n , 

V{a,X x + ■ • • + a n X n ) =±± a flj Cov(X„ X.) (5.11) 

i=\j=\ 
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Las comprobaciones se dan al final de la sección. Un parafraseo de (5.8) es que el valor espe¬ 
rado de una combinación lineal es la misma combinación lineal de los valores esperados, por 
ejemplo, E{2X¡ + 5X 2 ) = 2¡jl i + 5/a 2 . El resultado (5.9) en la proposición 2 es un caso especial 
de (5.11) en la proposición 3; cuando las X¡ son independientes, Cov(X ; , X) = 0 con i X j 
e igual a V(X¡) con i = j (esta simplificación en realidad ocurre cuando las X¡ no están correla¬ 
cionadas, una condición más débil que la de independencia). Especializando al caso de una 
muestra aleatoria (X¡ idénticamente distribuidas) con a¡ = \ln con cada i da E(X) = /i y V(X) = 
cr 2 ln, como se discutió en la sección 5.4. Un comentario similar se aplica a las reglas para T a . 

Ejemplo 5.28 Una gasolinería vende tres grados de gasolina; regular, extra y súper. Estas se venden a 
$21.20, $21.35 y $21.50 por galón, respectivamente. Sean X { , X 2 y X 3 las cantidades (galo¬ 
nes) de estas gasolinas compradas en un día particular. Suponga que las X¡ son indepen¬ 
dientes con /Xj = 1000, ¡Ju 2 = 500, /a 3 = 300, cr l = 100, cr 2 = 80, y cr 3 = 50. El ingreso por 
las ventas es Y = 21.2X l + 21.35Z 2 + 21.52í 3 y 

E(Y) = 2l.2¡i l + 21.35 ¡i z + 21.5/a 3 = $4125 
V(Y) = (21.2 ) 2 (t\ + (21.35) 2 o-2 + (21.5 ) 2 a\ = 104 025 
(t y = V104025 = $322.53 ■ 


Diferencia entre dos variables aleatorias 


Un caso especial importante de una combinación lineal se presenta con n = 2, a¡ = 1 y 
a 2 = - 1 : 

Y = a l X 1 + a 2 X 2 = X { - X 2 

Entonces se tiene el siguiente corolario de la proposición. 


COROLARIO 


E(X j — X 2 ) = E(X { ) — E(X 2 ) y, si y X 2 son independientes, V(X l — X 2 ) = 
V(Xj) + V(X 2 ). 


El valor esperado de una diferencia es la diferencia de los dos valores esperados, pero la 
varianza de una diferencia entre dos variables independientes es la suma, no la diferencia, 
de las dos varianzas. Existe tanta variabilidad en X { — X 2 como en X¡ + X 2 [escribiendo 
X¡ — X 2 = Xy + ( — 1 )X 2 , (— 1 )X 2 tiene la misma cantidad de variabilidad que X 2 ], 

Ejemplo 5.29 


E(X x - X 2 ) = ¡Xy - ijl 2 = 22 - 26 = -4 
V(Xy - X 2 ) = a] + ct\ = (1.2) 2 + (1.5) 2 = 3.69 
a x¡ _ Xi = Vl69 = 1.92 

Si se cambia la notación de modo que X ] se refiera al carro de cuatro cilindros, entonces 
E(Xy — X 2 ) = 4, pero la varianza de la diferencia sigue siendo de 3.69. ■ 

El caso de variables aleatorias normales 

Cuando las X¡ forman una muestra aleatoria de una distribución normal, X y T a están normal¬ 
mente distribuidas. He aquí un resultado más general con respecto a combinaciones lineales. 


Una compañía automotriz equipa un modelo particular con un motor de seis cilindros o un 
motor de cuatro cilindros. Sean X x y X 2 eficiencias de combustible de carros de seis y cua¬ 
tro cilindros seleccionados en forma independiente al azar, respectivamente. Con /a, = 22, 
ju , 2 = 26, o-y = 1.2 y cr 2 = 1.5, 
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PROPOSICIÓN 


Si X 1; X 2 , . . . , X n son variables aleatorias independientes normalmente distribuidas 
(con quizá diferentes medias y/o varianzas), entonces cualquier combinación lineal de 
las X¡ también tiene una distribución normal. En particular, la diferencia X, — X 2 entre 
dos variables independientes normalmente distribuidas también está distribuida en 
forma normal. 


Ejemplo 5.30 

(continuación 
del ejemplo 
5.28) 


El ingreso total por la venta de los tres grados de gasolina en un día particular fue Y = 21.2X¡ + 
21.35X 2 + 21 . 5 X 3 , y se calculó ¡jl y = 4125 y (suponiendo independencia) cr y = 322.53. Si las 
X¡ están normalmente distribuidas, la probabilidad de que el ingreso sea de más de 4500 es 


P{Y > 4500) = P Z> 


4500 - 4125 
322.53 

= P(Z> 1.16) = 1 - $(1.16) = 0.1230 


El teorema del límite central también puede ser generalizado para aplicarlo a ciertas combina¬ 
ciones lineales. En general, si n es grande y no es probable que algún término individual con¬ 
tribuya demasiado al valor total, entonces Y tiene aproximadamente una distribución normal. 


Comprobaciones en el caso n = 2 

En cuanto al resultado por lo concerniente a los valores esperados, suponga que Xj y X 2 son 
continuas con función de densidad de probabilidad conjunta/(x¡, x 2 ). Entonces 

-OO -OO 

E(a 1 X l + a 2 X 2 ) = (¿qXj + ¡, x 2 ) dx l dx 2 

*'—00*'—OO 
-OO pCO 

= a 1 f Xj/(x¡, x 2 ) dx 2 dx 1 

*'—00*'—OO 

-OO -OO 

+ a 2 x 2 f(x 1 , x 2 ) dx j dx 2 

—OO —OO 

-OO -OO 

= «i -*i/x,(-*i) dx 1 + a 2 \ x 2 / x ,(x 2 ) dx 2 

OO * / —oo 

= CI\E(X\) + a 2 E(X 2 ) 


La suma reemplaza a la integración en el caso discreto. El argumento en cuanto a la varian- 
za resultante no requiere especificar si la variable es discreta o continua. Recordando que 

V{Y) = E[(Y - ix Y n 

V(a l X l + a 2 X 2 ) = £'{[a 1 X 1 + a 2 X 2 — (a 1 /x l + a 2 /j, 2 )] 2 } 

= E{a\(X 1 - + fl 2 (X 2 - /q ,) 2 + 2a 1 a 2 (X 1 - /^((X 2 - q. 2 )} 

La expresión adentro de las llaves es una combinación lineal de las variables fj = (Xj — /x,) 2 , 
Y 2 = (X 2 — fi 2 ) 2 y Y 3 = (Xj — /Aj)(X 2 — /jl 2 ), así que si se acarrea la operación E a través de 
los tres términos se obtiene a 2 V(X¡) + a 2 V (X 2 ) + 2a 1 a 2 Cov(X 1 , X 2 ) como se requiere. ■ 


EJERCICIOS Sección 5.5 (58-74) 


58. Una compañía naviera maneja contenedores en tres dife¬ 
rentes tamaños: (1) 27 pies 3 (3 X 3 X 3), (2) 125 pies 3 y (3) 
512 pies 3 . SeaX¡ (i = 1, 2, 3) el número de contenedores de 
tipo i embarcados durante una semana dada. Con fju¡ = E(X¡) 


y cr?= V(X¡), suponga que los valores medios y las desvia¬ 
ciones estándar son como sigue: 

/Xj = 200 /x 2 = 250 jU, 3 = 100 

cr, = 10 cr, = 12 0 % = 8 
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a. Suponiendo que X¡, X 2 , X 3 son independientes, calcule el 
valor esperado y la varianza del volumen total embarca¬ 
do [Sugerencia: Volumen = 21X 1 + 125X 2 + 512X 3 .] 

b. ¿Serían sus cálculos necesariamente correctos si las X¡ 
no fueran independientes? Explique. 

59. Si X v X 2 y X 3 representan los tiempos necesarios para rea¬ 
lizar tres tareas de reparación sucesivas en cierto taller de 
servicio. Suponga que son variables aleatorias normales 
independientes con valores esperados fi 3 , /¿i y ¿i 3 y varian- 
zas a j, c r\ y cr 3 , respectivamente. 

a. Si ¿i = ju, 2 = /r 3 = 60 y cr\ = = cr\ = 15, calcule 

P(X l + X 2 + X 3 < 200). ¿Cuál es P(150 < X¡ + X 2 + 
X 3 < 200)? 

b. Con las fi¡ y cr¡ dadas en el inciso a), calcule P {55 £ X) 
y P(58 < X < 62). 

c. Con las ¡í¡ y a¡ dadas en el inciso a), calcule P (—10 £ 
Xj - 0.5X 2 - 0.5X 3 < 5). 

d. Si /rj = 40, ¿i 2 = 50, /x 3 = 60, cr\ = 10, cr 2 = 12, y 
<t\ = 14, calcule P(Xj + X 2 + X 3 < 160) y P(X 3 + 

X, > 2 X 3 ). 

60. Cinco automóviles del mismo tipo tienen que realizar un 

viaje de 300 millas. Los primeros dos utilizarán una marca 
económica de gasolina y los otros tres una marca de renom¬ 
bre. Sean X 1; X 2 , X 3 , X 4 y X s las eficiencias de combustible 
observadas (mpg) de los cinco carros. Suponga que estas 
variables son independientes y normalmente distribuidas 
con fj, l = fi 2 = 20, ¡x 3 = = 21 y a 2 = 4 con la mar¬ 

ca económica y 3.5 con la marca de renombre. Defina una 
variable aleatoria Y como 

x 1 + x 2 _ x 3 + x 4 + x 5 

2 3 

de modo que Y mide la diferencia de eficiencia entre la 
gasolina económica y la de renombre. Calcule P(0 £ Y) y 
P(— I < F < 1). [Sugerencia: Y= a 1 X l + • ■ • + a 5 X 5 , con 

= 1 = —11 

61. El ejercicio 26 introdujo variables aleatorias X y F, el núme¬ 
ro de carros y autobuses, respectivamente, transportados 
por un transbordador en un solo viaje. La función masa de 
probabilidad conjunta de X y Y se da en la tabla del ejerci¬ 
cio 7. Es fácil verificar que X y Y son independientes. 

a. Calcule el valor esperado, la varianza y la desviación 
estándar del número total de vehículos en un solo viaje. 

b. Si a cada carro se le cobran $3 y a cada autobús $10, 
calcule el valor esperado, la varianza y la desviación 
estándar del ingreso resultante de un solo viaje. 

62. Un fabricante de un cierto componente requiere tres opera¬ 
ciones de maquinado diferentes. El tiempo de maquinado de 
cada operación tiene una distribución normal y los tres tiem¬ 
pos son independientes entre sí. Los valores medios son 15, 
30 y 20 min, respectivamente y las desviaciones estándar 
son 1, 2 y 1.5 min respectivamente. ¿Cuál es la probabilidad 
de que se requiera cuando mucho una hora de tiempo de 
maquinado para producir un componente seleccionado al azar? 

63. Remítase al ejercicio 3. 

a. Calcule la covarianza entre X 3 = el número de clientes 
en la caja rápida y X 2 = el número de clientes en la caja 
súperrápida. 


b. Calcule V(X 3 + X 2 ). ¿Cómo se compara con VfXj) + 
V(X 2 )? 

64. Suponga que el tiempo de espera para un autobús en la maña¬ 
na está uniformemente distribuido en [0, 8], mientras que el 
tiempo de espera en la noche está uniformemente distribuido 
en [0, 10] independiente del tiempo de espera en la mañana. 

a. Si toma el autobús en la mañana y en la noche durante 
una semana, ¿cuál es su tiempo de espera total espera¬ 
do? [Sugerencia: Defina las variables aleatorias X l5 . . ., 
X 10 y use una regla de valor esperado.] 

b. ¿Cuál es la varianza de su tiempo de espera total? 

c. ¿Cuáles son el valor esperado y la varianza de la dife¬ 
rencia entre los tiempos de espera en la mañana y en la 
noche en un día dado? 

d. ¿Cuáles son el valor esperado y la varianza de la diferencia 
entre el tiempo de espera total en la mañana y el tiempo de 
espera total en la noche durante una semana particular? 

65. Suponga que cuando el pH de cierto compuesto químico es 
5.00, el pH medido por un estudiante de química de primer 
año seleccionado al azar es una variable aleatoria con media 
de 5.00 y desviación estándar de 0.2. Un gran lote del com¬ 
puesto se subdivide y a cada estudiante se le da una mues¬ 
tra en un laboratorio matutino y a cada estudiante en un 
laboratorio vespertino. SeaX = el pH promedio determina¬ 
do por los estudiantes matutinos y Y — el pH promedio 
determinado por los estudiantes vespertinos. 

a. Si el pH es una variable normal y hay 25 estudiantes 
en cada laboratorio, calcule P(— 0.1 £ X — Y £ 0.1). 
[Sugerencia: X — Y es una combinación lineal de varia¬ 
bles normales, así que está normalmente distribuida. 
Calcule ¡¿x-yY <T x-r -1 

b. Si hay 36 estudiantes en cada laboratorio, pero las deter¬ 
minaciones del pH no se suponen normales, calcule 
(aproximadamente) P(— 0.1 < X — Y < 0.1). 

66. Si se aplican dos cargas a una viga en voladizo como se 
muestra en la figura adjunta, el momento de flexión en 0 
debido a las cargas es a¡X¡ + a-,X 2 . 

X 2 


a. Suponga que X 3 y X, son variables independientes con 
medias de 2 y 4 klb, respectivamente y desviación 
estándar de 0.5 y 1.0 klb, respectivamente. Si a 3 = 5 
pies y a 2 = 10 pies, ¿cuál es el momento de flexión 
esperado y cuál es la desviación estándar del momento 
de flexión? 

b. Si X í y X, están normalmente distribuidas, ¿cuál es la 
probabilidad de que el momento de flexión sea de más 
de 75 klb-pie? 

c. Suponga que las posiciones de las dos cargas son varia¬ 
bles aleatorias. Denotándolas por Aj y A 2 , suponga que 
estas variables tienen medias de 5 y 10 pies, respectiva¬ 
mente, que cada una tiene una desviación estándar de 
0.5 y que todas las A¡ y X. son independientes entre sí. 
¿Cuál es el momento esperado ahora? 

d. En la situación del inciso c), ¿cuál es la varianza del 
momento de flexión? 
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e. Si la situación es como se describe en el inciso a) excep¬ 
to que Corr(Xj, X 2 ) = 0.5 (de modo que las dos cargas 
no sean independientes), ¿cuál es la varianza del mo¬ 
mento de flexión? 

67. Un tramo de tubería de PVC tiene que ser insertado en otro 
tramo. La longitud del primer tramo está normalmente dis¬ 
tribuido con valor medio de 20 pulg y desviación estándar 
de 0.5 pulg. El segundo tramo es una variable aleatoria nor¬ 
mal con media y desviación estándar de 15 pulg y 0.4 pulg, 
respectivamente. La cantidad de traslape está normalmente 
distribuido con valor medio de una pulg y desviación están¬ 
dar de 0.1 pulg. Suponiendo que los tramos y cantidad de 
traslape son independientes entre sí, ¿cuál es la probabili¬ 
dad de que la longitud total después de la inserción esté 
entre 34.5 pulg y 35 pulg? 

68. Dos aviones vuelan en la misma dirección en dos corredo¬ 
res adyacentes. En el instante f = 0, el primer avión está a 
10 km adelante del segundo. Suponga que la velocidad del 
primero (km/h) está normalmente distribuida con media de 
520 y desviación estándar de 10 y que la velocidad del 
segundo también está normalmente distribuida con media y 
desviación estándar de 500 y 10, respectivamente. 

a. ¿Cuál es la probabilidad de que después de 2 horas de 
vuelo, el segundo avión no haya alcanzado al primer 
avión? 

b. Determine la probabilidad de que los aviones estén 
separados cuando mucho 10 km después de 2 horas. 

69. Tres carreteras diferentes entroncan en una autopista particu¬ 
lar. Suponga que durante un tiempo fijo, el número de 
carros que llegan por cada carretera a la autopista es una 
variable aleatoria, con valor esperado y desviación estándar 
como se dan en la tabla 



Carretera 1 

Carretera 2 Carretera 3 

Valor esperado 

800 

1000 

600 

Desviación estándar 

16 

25 

18 


a. ¿Cuál es el número de carros total esperado que entran 
a la autopista en este punto durante el periodo? 
[Sugerencia: Sea X¡ = el número de la carretera ;.] 

b. ¿Cuál es la varianza del número total de carros que 
entran? ¿Lia hecho suposiciones sobre la relación entre 
los números de carros en las diferentes carreteras? 

c. Con X¡ denotando el número de carros que entran de la 
carretera i durante el periodo, suponga que Cov(Xj, 
X 2 ) = 80, Cov(Xj, X 3 ) = 90 y Cov(X 2 , X 3 ) = 100 (de 
modo que las tres corrientes de tráfico no son indepen¬ 
dientes). Calcule el número total esperado de los carros 
que entran y la desviación estándar del total. 

70. Considere una muestra aleatoria de tamaño n tomada de una 
distribución continua con mediana 0 de modo que la proba¬ 
bilidad de cualquier observación sea positiva de 0.5. Ha¬ 
ciendo caso omiso de los signos de las observaciones, 
clasifíquelas desde la más pequeña a la más grande en valor 
absoluto y sea W = la suma de las filas de las observacio¬ 
nes con signos positivos. Por ejemplo, si las observaciones 
son —0.3, +0.7, +2.1 y —2.5, entonces las filas de obser¬ 
vaciones positivas son 2 y 3, de modo que W = 5. En el 
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capítulo 15, W se llamará estadístico de filas con signo de 
Wilcoxon. W puede representarse como sigue: 

VE = 1 • Fj + 2 • Y 2 + 3 • T 3 + ■ • ■ + n ■ F„ 

n 

= 1 i-Y t 

i= 1 

donde las Y¡ son variables aleatorias independientes de 
Bernoulli, cada una con p = 0.5(F, = 1 corresponde a la 
observación con fila i positiva). 

a. Determine E(Y¡) y luego E(W) utilizando la ecuación 
para W. [Sugerencia: Los primeros n enteros positivos 
suman n(n + l)/2.] 

b. Determine V(Y¡) y luego V(W). [Sugerencia: La suma de 
los cuadrados de los primeros n enteros positivos puede 
expresarse como n(n + l)(2n + l)/6.] 

71. En el ejercicio 66, el peso de viga contribuye al momento 
de flexión. Suponga que la viga es de espesor y densidad 
uniformes, de modo que la carga resultante esté uniforme¬ 
mente distribuida en la viga. Si el peso de ésta es aleatorio, 
la carga resultante a consecuencia del peso también es alea¬ 
toria; denote esta carga por VF(klb-pies). 

a. Si la viga es de 12 pies de largo, W tiene una media de 
1.5 y una desviación estándar de 0.25 y las cargas fijas 
son como se describen en el inciso a) del ejercicio 66, 
¿cuáles son el valor esperado y la varianza del momen¬ 
to de flexión? [Sugerencia: Si la carga originada por la 
viga fuera w klb-pies, la contribución al momento de fle¬ 
xión sería w j^ 2 x dx.\ 

b. Si las tres variables (X 3 , X, y W) están normalmente dis¬ 
tribuidas, ¿cuál es la probabilidad de que el momento de 
flexión será cuando mucho de 200 klb-pies? 

72. Tengo tres encargos que atender en el edificio de administra¬ 
ción. Sea X¡ = el tiempo que requiere el i-ésimo encargo 
(i = 1, 2, 3) y seaX 4 = el tiempo total en minutos que me pa¬ 
so caminando hasta y desde el edificio y entre cada encargo. 
Suponga que las X¡ son independientes y normalmente distri¬ 
buidas con las siguientes medias y desviaciones estándar 
p l = 15, (7j = 4, ¿i, = 5, <t 2 = 1, p 3 = 8, cr 3 = 2, p 4 = 12, 
cr 4 = 3. Pienso salir de mi oficina precisamente a las 10:00 
a.m. y deseo pegar una nota en la puerta que diga “Regreso al¬ 
rededor de las t a.m.”. ¿Qué hora debo escribir si deseo que la 
probabilidad de mi llegada después de t sea de 0.01? 

73. Suponga que la resistencia a la tensión de acero tipo A es 
de 105 klb 2 y que la desviación estándar de la resistencia a 
la tensión es de 8 klb 2 . Para acero tipo B, suponga que la 
resistencia a la tensión esperada y la desviación estándar de 
la resistencia a la tensión son de 100 klb 2 y 6 klb 2 , respec¬ 
tivamente. Sea X = la resistencia a la tensión promedio de 
una muestra aleatoria de 40 especímenes tipo A y sea Y = 
la resistencia a la tensión promedio de una muestra aleato¬ 
ria de 35 especímenes tipo B. 

a. ¿Cuál es la distribución aproximada de X? ¿De T? 

b. ¿Cuál es la distribución aproximada de X — F? Justifi¬ 
que su respuesta. 

c. Calcule (aproximadamente) P(— 1 £ X — Y £ 1). 

d. Calcule P{X — Y > 10). Si en realidad observó X — Y 
£ 10, dudaría que p l — p 2 = 5? 
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74. En un área de suelo arenoso se plantaron 50 árboles 
pequeños de un cierto tipo y otros 50 se plantaron en un 
área de suelo arcilloso. Sea X = el número de árboles 
plantados en suelo arenoso que sobreviven un año y Y = el 
número de árboles plantados en suelo arcilloso que sobre¬ 


viven un año. Si la probabilidad de que un árbol plantado 
en suelo arenoso sobreviva un año es de 0.7 y la probabili¬ 
dad de sobrevivencia de un año en suelo arcilloso es de 0.6, 
calcule una aproximación a P( — 5 £ A — Y £ 5) (no se 
moleste con la corrección de continuidad). 


EJERCICIOS SUPLEMENTARIOS (75-95) 


75. Un restaurante sirve tres comidas que cuestan $12, $15 y 
$20. Para una pareja seleccionada al azar que está comien¬ 
do en este restaurante, sea X = el costo de la comida del 
hombre y Y = el costo de la comida de la mujer. La función 
masa de probabilidad conjunta de X y Y se da en la siguien¬ 
te tabla: 


y 


p(x, y) 

12 

15 

20 


12 

0.05 

0.05 

0.10 

X 

15 

0.05 

0.10 

0.35 


20 

0 

0.20 

0.10 


a. Calcule las funciones masa de probabilidad marginal de 
X y Y. 

b. ¿Cuál es la probabilidad de que las comidas del hombre 
y la mujer cuesten cuando mucho $15 cada una? 

c. ¿Son X y Y independientes? Justifique su respuesta. 

d. ¿Cuál es el costo total esperado de la comida de las dos 
personas? 

e. Suponga que cuando una pareja abre las galletas de la 
fortuna al final de la comida, encuentran el mensaje 
“Recibirá como reembolso la diferencia entre el costo de 
la comida más cara y la menos cara que eligió”. ¿Cuánto 
espera reembolsar el restaurante? 

76. En una estimación de costos, el costo total de un proyecto 
es la suma de los costos de las tareas componentes. Cada 
uno de estos costos es una variable aleatoria con distribución 
de probabilidad. Se acostumbra obtener información sobre 
la distribución de costos total sumando las características 
de las distribuciones de costo de componente individuales; 
esto se conoce como procedimiento de “despliegue”. Por 
ejemplo, E(X l + • • • + X n ) = ECXj) + ■ ■ • + E(X n ), así que 
el procedimiento de despliegue es válido para costo medio. 
Suponga que hay dos tareas componentes y que A¡ y X 2 son 
variables aleatorias independientes normalmente distribui¬ 
das. ¿Es válido el procedimiento de despliegue para el 75° 
percentil? Es decir, ¿Es el 75° percentil de la distribución de 
X l + Xr, el mismo que la suma de los 75° percentiles de las 
dos distribuciones individuales? Si no, ¿cuál es la relación 
entre el percentil de la suma y la suma de los percentiles? 
¿Con qué percentiles es válido el procedimiento de desplie¬ 
gue en este caso? 

77. Una tienda de comida saludable vende dos marcas diferen¬ 
tes de un tipo de grano. Sea X = la cantidad (Ib) de la mar¬ 
ca A disponible y Y = la cantidad de la marca B, disponible. 
Suponga que la función de densidad de probabilidad con¬ 
junta de A y K es 

_\kxy x > 0, y > 0, 20 < x + y < 30 
’ y> 0 de lo contrario 


a. Trace la región de densidad positiva y determine el valor 
de k. 

b. ¿Son X y Y independientes? Responda obteniendo pri¬ 
mero la función de densidad de probabilidad marginal 
de cada variable. 

c. Calcule P(X + Y < 25). 

d. ¿Cuál es la cantidad total esperada de este grano dis¬ 
ponible? 

e. Calcule Cov(A, Y) y Corr(A, Y). 

f. ¿Cuál es la varianza de la cantidad total de grano 
disponible? 

78. Sean Aj, X 2 , . . . , X n variables aleatorias que denotan n pos¬ 
turas independientes para un artículo que está a la venta. 
Suponga que cada X¡ está uniformemente distribuida en el 
intervalo [100, 200]. Si el vendedor se lo vende al postor más 
alto, ¿cuánto puede esperar ganar en la venta? [ Sugerencia: 
Sea Y = máxfAj, X 2 ,. . . , X n ). Primero halle Fy(y) observan¬ 
do que T < y si y sólo si cada X¡ es £ y. Luego obtenga la 
función de densidad de probabilidad y E(Y).] 

79. Suponga que para un individuo, la ingesta de calorías en el 
desayuno es una variable aleatoria con valor esperado de 
500 y desviación estándar de 50, la ingesta de calorías en el 
almuerzo es aleatoria con valor esperado de 900 y desvia¬ 
ción estándar de 100 y la ingesta de calorías en la comida 
es una variable aleatoria con valor esperado de 2000 y des¬ 
viación estándar de 180. Suponiendo que las ingestas en las 
diferentes comidas son independientes entre sí, ¿cuál es la 
probabilidad de que la ingesta de calorías promedio por día 
durante el siguiente año (365 días) sea cuando mucho de 
3500? [ Sugerencia: Sean X¡, Y¡ y Z¡ las tres ingestas de calo¬ 
rías en el día i. Entonces la ingesta total es 2(A, + Y¡ + Z,).] 

80. El peso medio del equipaje documentado por un pasajero de 
clase turista seleccionado al azar que vuela entre dos ciuda¬ 
des en cierta aerolínea es de 40 Ib y la desviación estándar 
es de 10 Ib. La media y la desviación estándar de un pasa¬ 
jero de clase de negocios son 30 Ib y 6 Ib, respectivamente. 

a. Si hay 12 pasajeros de clase de negocios y 50 de clase 
turista en un vuelo particular, ¿cuáles son el valor espe¬ 
rado y la desviación estándar del peso total del equipaje? 

b. Si los pesos individuales de los equipajes son variables 
aleatorias independientes normalmente distribuidas, 
¿cuál es la probabilidad de que el peso total del equipa¬ 
je sea cuando mucho de 2500 Ib? 

81. Se ha visto que si E(X t ) = E(X 2 ) = ■ • • = E(X n ) = ¿i, 
entonces E(X¡ + • • ■ + X n ) = n/i. En algunas aplicacio¬ 
nes, el número de X¡ considerado no es un número fijo n 
sino una variable aleatoria N. Por ejemplo, sea N = el 
número de componentes que son traídos a un taller de repa¬ 
ración en un día particular y sea X¡ el tiempo de reparación 
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del ¡-ésimo componente, entonces el tiempo de reparación 
total es X í + X 2 + • ■ • + X N , la suma de un número aleato¬ 
rio de variables aleatorias. Cuando N es independiente de 
las X¡ se puede demostrar que 

E(X i + ■ • • + X N ) = E(N) ■ p 

a. Si el número de componentes traídos en un día particu¬ 
lar es 10 y el tiempo de reparación esperado de un com¬ 
ponente seleccionado al azar es de 40 min, ¿cuál es el 
tiempo de reparación total de componentes entregados 
en cualquier día particular? 

b. Suponga que componentes de un tipo llegan para ser repa¬ 
rados de acuerdo en un proceso de Poisson a razón de cin¬ 
co por hora. El número esperado de defectos por 
componente es de 3.5. ¿Cuál es el valor esperado del 
número total de defectos en componentes traídos a repara¬ 
ción durante un periodo de cuatro horas? Asegúrese de 
indicar cómo su respuesta se deriva del resultado general 
que se acaba de dar. 

82. Suponga que la proporción de votantes rurales en un estado 
que favorecen a un candidato particular es de 0.45 y que la 
proporción de votantes suburbanos y urbanos que favorecen 
al candidato es de 0.60. Si se obtiene una muestra de 200 
votantes rurales y 300 votantes suburbanos y urbanos, ¿cuál 
es la probabilidad aproximada de que por lo menos 250 
de estos votantes favorezcan a este candidato? 

83. Sea /a, el pH verdadero de un compuesto químico. Se reali¬ 
zará una secuencia de n determinaciones de pH muéstrales 
independientes. Suponga que cada pH muestra es una varia¬ 
ble aleatoria con valor esperado p y desviación estándar de 
0.1. ¿Cuántas determinaciones se requieren si se desea que 
la probabilidad de que el promedio muestral esté dentro 
de 0.02 de pH verdadero sea por lo menos de 0.95? ¿Qué 
teorema justifica su cálculo de probabilidad? 

84. Si la cantidad de refresco que consumo en cualquier día dado 
es independiente del consumo en cualquier otro día y está 
normalmente distribuido con /x = 13ozy<r = 2yen este 
momento tengo dos paquetes de seis botellas de 16 oz, ¿cuál 
es la probabilidad de que todavía tenga algo de refresco 
al cabo de 2 semanas (14 días)? 

85. Remítase al ejercicio 58 y suponga que las X¡ son indepen¬ 
dientes entre sí y que cada una tiene una distribución nor¬ 
mal. ¿Cuál es la probabilidad de que el volumen total 
embarcado sea cuando mucho de 100 000 pies 3 ? 

86. Un estudiante tiene una clase que se supone termina a las 
9:00 a.m. y otra que se supone comienza a las 9:10 a.m. Su¬ 
ponga que el tiempo real de terminación de la clase de las 
9:00 a.m. es una variable aleatoria normalmente distribuida 
X¡ con media de 9:02 y desviación estándar de 1.5 min y que 
la hora de inicio de la siguiente clase también es una varia¬ 
ble aleatoria normalmente distribuida X, con media de 9:10 
y desviación estándar de un min. Suponga que el tiempo ne¬ 
cesario para ir de un salón de clases al otro es una variable 
aleatoria normalmente distribuida X 3 con media de 
seis min y desviación estándar de un min. ¿Cuál es la proba¬ 
bilidad de que el estudiante llegue a la segunda clase antes 
de que comience? (Suponga independencia de X v X 2 y X 3 , 
la cual es razonable si el estudiante no presta atención a la 
hora de terminación de la primera clase.) 


Ejercicios suplementarios 225 

87. a. Use la fórmula general de la varianza de una combinación 

lineal para escribir una expresión para V(aX + Y). Luego 
si a = o-y/a x , y demuestre que p > — 1. [ Sugerencia: La 
varianza siempre esSOy Cov(X, Y) — cr x • cr r • p.] 

b. Considerando que V(aX — Y), concluya que p £ 1. 

c. Use el hecho de que V(W) = 0 sólo si W es una cons¬ 
tante para demostrar que p = 1 sólo si Y = aX + b. 

88. Suponga que una calificación oral X y una calificación 
cuantitativa Y de un individuo seleccionado al azar en un 
examen de aptitud aplicado a nivel nacionalmente tienen 
una función de densidad de probabilidad conjunta 

.. , 4(2*+ 3y) 0<x<l, 0<y<l 

f(x, y) = 5 

l 0 de lo contrario 

Se le pide que haga una predicción t de la calificación total 
X + Y del individuo. El error de predicción es la media del 
error al cuadrado E[{X + Y — f) 2 ], ¿Qué valor de t reduce al 
mínimo el error de predicción? 

89. a. Que X¡ tenga una distribución ji cuadrada con parámetro 

iq (véase la sección 4.4) y que X 2 sea independiente de 
X l y que tenga una distribución ji cuadrada con paráme¬ 
tro v 2 . Use la técnica del ejemplo 5.21 para demostrar 
que Xj + X n tiene una distribución ji cuadrada con pará¬ 
metro iq + v 2 . 

b. En el ejercicio 71 del capítulo 4, se le pidió que demos¬ 
trara que si Z es una variable normal estándar, entonces 
Z 2 tiene una distribución ji cuadrada con v = 1. Sean Z v 
Z 2 , . . . , Z n n variables aleatorias normales estándar. 
¿Cuál es la distribución de Z¡ + ■ ■ ■ + Z 2 ? Justifique su 
respuesta. 

c. Sean X u . . . , X„ una muestra aleatoria de una distribu¬ 
ción normal con media p y varianza o 2 . ¿Cuál es la dis¬ 
tribución de la suma Y = 2" =1 [(X ¿ — p)/o-] 2 ? Justifique 
su respuesta. 

90. a. Demuestre que Cov(X, Y + Z) = Cov(X, Y) + Cov(X, Z). 
b. Sean Xj y X 2 calificaciones cuantitativas y orales en un 

examen de aptitud y sean Y t y Y 2 calificaciones corres¬ 
pondientes en otro examen. Si Cov(Xj, Jj) = 5, Cov^, 
Y 2 ) = 1, Cov(X 2 , YJ = 2 y Cov(X 2 , Y 2 ) = 8, ¿cuál es la 
covarianza entre las dos calificaciones totales Xj + X, y 
Yi + ^ 2 ? 

91. Se selecciona al azar y se pesa dos veces un espécimen de roca 
de un área particular. Sea W el peso real y X! y X 2 los dos pesos 
medidos. Entonces X 3 = W + £j y X 2 = W + E 2 , donde £j y 
E 2 son los dos errores de medición. Suponga que los E¡ son 
independientes entre sí y de W y que V(£j) = V(E 2 ) = <x|. 

a. Exprese p, el coeficiente de correlación entre los dos 
pesos medidos X¡ y X 2 en función de <xJ,, la varianza 
del peso real y o -2 , la varianza del peso medido. 

b. Calcule p cuando a w = 1 kg y a E = 0.01 kg. 

92. Sea A el porcentaje de un constituyente en un espécimen de 
roca seleccionado al azar y sea B el porcentaje de un segundo 
constituyente en ese mismo espécimen. Suponga que D y E 
son errores de medición al determinar los valores de A y B de 
modo que los valores medidos sea X = A + DyY=B + E, 
respectivamente. Suponga que los errores de medición son 
independientes entre sí y de los valores reales. 
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226 CAPÍTULO 5 Distribuciones de probabilidad conjunta y muestras aleatorias 


a. Demuestre que 

Corr(Y, Y) = Corr(A, B) • VCorr(Yj, X 2 ) ■ VcóñlY^) 
donde X 3 y X 2 son mediciones replicadas del valor de A 
y Y¡ y K, se definen análogamente con respecto a B. 
¿Qué efecto tiene la presencia del error de medición en 
la correlación? 

b. ¿Cuál es valor máximo de Corr(Y, Y) cuando CorrQQ, 
X 2 ) = 0.8100 y ConfL,, Y 2 ) = 0.9025? ¿Es esto per¬ 
turbador? 


X 3 , X 2 , X 3 conectadas en paralelo a través de una batería con 
voltaje X 4 . Luego, según la ley de Ohm, la corriente es 


Y = X 4 





Sea = 10 ohms, cr 1 = 1.0 ohms, /r, = 15 ohms, cr 2 = 1.0 
ohms, fi 3 = 20 ohms, cr 3 = 1.5 ohms, p, 4 = 120 V, cr 4 = 4.0 V. 
Calcule el valor esperado aproximado y la desviación están¬ 
dar de la corriente (sugerido por “Random Samplings”, 
CHEMTECH , 1984: 696-697). 


93. Sean X¡, . . . , X n variables aleatorias independientes con 
valores medios p.¡, ..., y varianzas <x¡, . . . , a 2 . 
Considere una función h(x v ... ,x n ) y úsela para definir una 
nueva variable aleatoria Y = h(X v . . . , X n ). En condiciones 
un tanto generales en cuanto a la función h, si las cr ¡ son 
pequeñas con respecto a las ¿i, correspondientes se puede 
demostrar que E(Y) ~ h(p. x , . . ., fjuj y 


/ dh \ 2 

/ dh \ : 

( - | ■ <T? + ' ' 

■ + - 




donde cada derivada parcial se evalúa en (x v . . . , x n ) = 
(¡jl v . . . , fi n ). Suponga tres resistores con resistencias 


94. Una aproximación más precisa a E[h(X v . . . , X n )\ en el 
ejercicio 93 es 

1 / d 2 h \ 1 / d 2 h \ 

.'‘■ ) + 7 T 'D4r " + Ht5) 

Calcule esto con Y = h(X¡, X 2 , X 3 , X 4 ) dada en el ejercicio 
93 y compárela con el primer término . . . , ¡x n ). 

95. Sean X y Y variables aleatorias normales estándar indepen¬ 
dientes y defina una nueva variable aleatoria como U = 0.6X 
+ 0.87. 

a. Determine Corr(X, U). 

b. ¿Cómo modificaría U para obtener Corr(X, U) = p con 
un valor especificado de p? 
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INTRODUCCIÓN 

Dado un parámetro de interés, tal como la media ¡i o la proporción p de una pobla¬ 
ción, el objetivo de la estimación puntual es utilizar una muestra para calcular un 
número que representa en cierto sentido una buena suposición del valor verdadero 
del parámetro. El número resultante se llama estimación puntual. En la sección 6.1, 
se presentan algunos conceptos generales de estimación puntual. En la sección 6.2, se 
describen e ¡lustran dos métodos importantes de obtener estimaciones puntuales: el 
método de momentos y el método de máxima probabilidad. 
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228 CAPÍTULO 6 Estimación puntual 


6.1 Algunos conceptos generales de estimación puntual 

El objetivo de la inferencia estadística casi siempre es sacar algún tipo de conclusión sobre 
uno o más parámetros (características de la población). Para hacer eso un investigador tie¬ 
ne que obtener datos muéstrales de cada una de las poblaciones estudiadas. Las conclusio¬ 
nes pueden entonces basarse en los valores calculados de varias cantidades muéstrales. Por 
ejemplo, sea ¡x (un parámetro) la resistencia a la ruptura promedio verdadera de conexiones 
alámbricas utilizadas en la unión de obleas semiconductoras. Se podría tomar una muestra 
aleatoria de n = 10 conexiones y determinar la resistencia a la ruptura de cada una y se ten¬ 
drían las resistencias observadas x v x 2 , . . . , x 10 . La resistencia a la ruptura media muestral 
x se utilizaría entonces para sacar una conclusión con respecto al valor de /x. Asimismo, si 
a 2 es la varianza de la distribución de la resistencia a la ruptura (varianza de la población, 
otro parámetro), el valor de la varianza muestral s 2 se utiliza para inferir algo sobre cr 2 . 

Cuando se discuten los métodos y conceptos generales de inferencia, es conveniente 
disponer de un símbolo genérico para el parámetro de interés. Se utilizará la letra griega 9 
para este propósito. El objetivo de la estimación puntual es seleccionar un solo número, con 
base en los datos muéstrales, que represente un valor sensible de 9. Supóngase, por ejem¬ 
plo, que el parámetro de interés es ¡x, la vida útil promedio verdadera de baterías de un tipo. 
Una muestra aleatoria de n = 3 baterías podría dar las vidas útiles (horas) observadas x¡ = 
5.0, x 2 = 6.4, x 3 = 5.9. El valor calculado de la vida útil media muestral es x = 5.77 y es 
razonable considerar 5.77 como un valor muy factible de ¡x, la “mejor suposición” del valor 
de [x basado en la información muestral disponible. 

Supóngase que se desea estimar un parámetro de una población (p. ej., ¡x o cr) con una 
muestra aleatoria de tamaño n. Recuérdese por el capítulo previo de que antes que los datos 
estén disponibles, las observaciones muéstrales deben ser consideradas como variables alea¬ 
torias Aj, X 2 , . . ., X n . Se deduce que cualquier función de las X¡, es decir, cualquier estadís¬ 
tico, tal como la media muestral X o la desviación estándar muestral S también es una 
variable aleatoria. Lo mismo es cierto si los datos disponibles se componen de más de 
una muestra. Por ejemplo, se pueden representar las resistencias a la tensión de m especí¬ 
menes de tipo 1 y de n especímenes de tipo 2 por Aj ,... ,X m y 7¡, . . ., Y n , respectivamen¬ 
te. La diferencia entre las dos resistencias medias muéstrales es X — Y, el estadístico natural 
para inferir sobre /j_¡ — ¡x 2 , la diferencia entre las resistencias medias de la población. 


DEFINICIÓN 


Una estimación puntual de un parámetro 0 es un número único que puede ser con¬ 
siderado como un valor sensible de 9. Se obtiene una estimación puntual seleccio¬ 
nando un estadístico apropiado y calculando su valor con los datos muéstrales dados. 
El estadístico seleccionado se llama estimador puntual de 9. 


En el ejemplo de la batería que se acaba de dar, el estimador utilizado para obtener la 
estimación puntual de ¡x fue A y la estimación puntual de /x fue 5.77. Si las tres vidas útiles 
hubieran sido x í = 5.6, x 2 = 4.5 yx 3 = 6.1, el uso del estimador X habría dado por resulta¬ 
do la estimación x = (5.6 + 4.5 + 6.1)/3 = 5.40. El símbolo 0 (“teta testada”) se utiliza 
comúnmente para denotar tanto la estimación de 9 como la estimación puntual que resulta 
de una muestra dada.* Por tanto, jx = X se lee como “el estimador puntual de ¡x es la media 


* 


Siguiendo la primera notación, se podría utilizar © (teta mayúscula) para el estimador, pero ésta es difícil de 
escribir. 
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Ejemplo 6.1 


Ejemplo 6.2 


e 
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muestral X”. La proposición “la estimación puntual de p es 5.77” se escribe concisamente 
como jl = 5.77. Obsérvese que cuando se escribe 0 = 72.5, no hay ninguna indicación 
de cómo se obtuvo esta estimación puntual (qué estadístico se utilizó). Se recomienda repor¬ 
tar tanto el estimador como la estimación resultante. 


Un fabricante automotriz ha producido un nuevo tipo de defensa, la que se presume absor¬ 
be impactos con menos daño que las defensas previas. El fabricante ha utilizado esta defen¬ 
sa en una secuencia de 25 choques controlados con un muro, cada uno a 10 mph, utilizando 
uno de sus modelos de carro compacto. Sea X = el número de choques que no provocaron 
daños visibles al automóvil. El parámetro que tiene que ser estimado es p = la proporción 
de todos los choques que no provocaron daños [alternativamente, p = Ptningún daño en un 
choque)]. Si se observa que X es x = 15, el estimador y estimación más razonables son 

X x 15 

estimador p = — estimación = — = — = 0.60 ■ 

n n 25 

Si por cada parámetro de interés hubiera sólo un estimador puntual razonable, no 
habría mucho para la estimación puntual. En la mayoría de los problemas, sin embargo, habrá 
más de un estimador razonable. 


Reconsidere las 20 observaciones adjuntas de voltaje de ruptura dieléctrica de piezas de 
resina epóxica introducidas por primera vez en el ejemplo 4.30 (sección 4.6). 

24.46 25.61 26.25 26.42 26.66 27.15 27.31 27.54 27.74 27.94 

27.98 28.04 28.28 28.49 28.50 28.87 29.11 29.13 29.50 30.88 

El patrón en la gráfica de probabilidad normal dado allí es bastante recto, así que ahora se 
supone que la distribución de voltaje de ruptura es normal con valor medio p. Como las dis¬ 
tribuciones normales son simétricas, p también es la vida útil mediana de la distribución. Se 
supone entonces que las observaciones dadas son el resultado de una muestra aleatoria X¡, 
X 2 , . . . , X 20 de esta distribución normal. Considere los siguientes estimadores y las estima¬ 
ciones resultantes de p: 

a. Estimador = X, estimación = x = Jjxjn = 555.86/20 = 27.793 

b. Estimador = X, estimación = x = (27.94 + 27.98)/2 = 27.960 

c. Estimador = [mín(7Q + máx(2Q]/2 = el promedio de las dos vidas útiles extremas, esti¬ 
mación = [mín(x;) + máx(x ; )]/2 = (24.46 + 30.88)/2 = 27.670 

d. Estimador = la media 10% recortada (desechar el 10% más pequeño y más gran¬ 

de de la muestra y luego promediar). 

estimación = x lr( , 0) 

= 555.86 - 24.46 - 25.61 - 29.50 - 30.88 

16 

= 27.838 

Cada uno de los estimadores a) al d) utiliza una medición diferente del centro de la mues¬ 
tra para estimar p. ¿Cuál de las estimaciones se acerca más al valor verdadero? No se puede 
responder esta pregunta sin conocer el valor verdadero. Una pregunta que se puede hacer es: 
“¿Cuál estimador, cuando se utiliza en otras muestras de X¡, tiende a producir estimaciones 
cercanas al valor verdadero? En breve se considerará este tipo de pregunta. ■ 




















c6_p227-253.qxd 3/12/08 4:12 M Page 230 




230 CAPÍTULO 6 Estimación puntual 

Ejemplo 6.3 En el futuro inmediato habrá un creciente interés por desarrollar aleaciones de Mg de bajo 
costo para varios procesos de fundición. Es por consiguiente importante contar con formas 
prácticas de determinar varias propiedades mecánicas de esas aleaciones. El artículo “On 
the Development of a New Approach for the Determination of Yield Strength in Mg-based 
Alloys” (Light Metal Age, octubre de 1998: 50-53) propuso un método ultrasónico para este 
propósito. Considere la siguiente muestra de observaciones de módulo elástico (GPa) de 
especímenes de aleación AZ91D tomados de un proceso de fundición a troquel: 

44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1 

Suponga que estas observaciones son el resultado de una muestra aleatoria A,,..., X 8 toma¬ 
da de la distribución de población de módulos elásticos en semejantes circunstancias. Se 
desea estimar la varianza de la población a 2 . Un estimador natural es la varianza muestral: 

,, Z(X r X ) 2 - (Xxf/n 

cr- = b- = -= - 

n — 1 n — 1 


La estimación correspondiente es 

~2 = 2 _ E-vj^ (Hx,) 2 /8 = 15533.79 - (352.5) 2 /8 
7 7 

= 0.25125 « 0.251 


La estimación de cr sería entonces & = s = v 0.25125 = 0.501. 

Si se utiliza el divisor n en lugar de n — 1 se obtendría un estimador alternativo (es 
decir, la desviación al cuadrado promedio): 


£(*,.-*) 2 


1.75875 „„„„ 

estimación =-= 0.220 


En breve se indicará por qué muchos estadísticos prefieren S 2 al estimador con divisor n. ■ 


En el mejor de todos los mundos posibles, se podría hallar un estimador 9 con el cual 
9=9 siempre. Sin embargo, 0 es una función de las X¡ muéstrales, así que es una variable 
aleatoria. Con algunas muestras, 9 dará un valor más grande que 9, mientras que con otras 
muestras 9 subestimará 9. Si se escribe 

9 = 9 + error de estimación 


entonces un estimador preciso sería uno que produzca errores de estimación pequeños, así 
que los valores estimados se aproximarán al valor verdadero. 

Una forma sensible de cuantificar la idea de 9 cercano a 9 es considerar el error al 
cuadrado (9 — 9) 2 . Con algunas muestras, 9 se acercará bastante a 9 y el error al cuadrado 
se aproximará a 0. Otras muestras pueden dar valores de 9 alejados de 9 , correspondientes 
a errores al cuadrado muy grandes. Una medida general de precisión es el error cuadrático 
medio ECM = E[(9 — 9) 2 ]. Si un primer estimador tiene una media del error al cuadrado 
más pequeña que un segundo, es natural decir que el primer estimador es el mejor. Sin 
embargo, el error cuadrático medio en general dependerá del valor de 9. Lo que a menudo 
sucede es que un estimador tendrá una media del error al cuadrado más pequeña con algu¬ 
nos valores de 9 y una media del error al cuadrado más grande con otros valores. En gene¬ 
ral no es posible determinar un estimador con el error cuadrático medio mínimo. 

Una forma de librarse de este dilema es limitar la atención sólo en estimadores que 
tengan una propiedad deseable específica y luego determinar el mejor estimador en este 
grupo limitado. Una propiedad popular de esta clase en la comunidad estadística es el inses- 
g amiento. 
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Estimadores insesgados 

Supóngase que se tienen dos instrumentos de medición: uno ha sido calibrado con precisión, 
pero el otro sistemáticamente da lecturas más pequeñas que el valor verdadero que se está 
midiendo. Cuando cada uno de los instrumentos se utiliza repetidamente en el mismo obje¬ 
to, debido al error de medición, las mediciones observadas no serán idénticas. Sin embargo, 
las mediciones producidas por el primer instrumento se distribuirán en tomo al valor verdade¬ 
ro de tal modo que en promedio este instmmento mide lo que se propone medir, por lo que este 
instrumento se conoce como instrumento insesgado. El segundo instrumento proporciona 
observaciones que tienen un componente de error o sesgo sistemático. 


DEFINICIÓN 


Se dice que un estimador puntual 6 es un estimador insesgado de 9 si E(9) = 6 con 
todo valor posible de 9 . Si 9 no es insesgado, la diferencia E(9 ) — 9 se conoce como 
el sesgo de 9. 


Es decir, 9 es insesgado si su distribución de probabilidad (es decir, muestreo) siempre está 
“centrada” en el valor verdadero del parámetro. Supóngase que 9 es un estimador insesgado; 
entonces si 9 = 100, la distribución muestral 9 está centrada en 100; si 9 = 27.5, en ese caso 
la distribución muestral 9 está centrada en 27.5, y así sucesivamente. La figura 6.1 ilustra la 
distribución de varios estimadores sesgados e insesgados. Obsérvese que “centrada” en este 
caso significa que el valor esperado, no la mediana de la distribución de 9 es igual a 9. 



Función de densidad 

A 

de probabilidad de 0 2 



Función de densidad 

A 

probabilidad de 0 j 


Sesgo de 0 j 


Función de densidad 

A 

de probabilidad de 0 2 



Función de densidad 

A 

de probabilidad de 


Sesgo de 6 


Figura 6.1 Funciones de densidad de probabilidad de un estimador sesgado d 1 y un estimador in¬ 
sesgado de un parámetro 8. 



Parece como si fuera necesario conocer el valor de 9 (en cuyo caso la estimación es 
innecesaria) para ver si 9 es insesgado. Este casi nunca es el caso, puesto que insesgamien- 
to es una propiedad general del estimador muestral, donde se centra, y generalmente no 
depende de cualquier valor de parámetro particular. 

En el ejemplo 6.1, se utilizó la proporción muestral Xln como estimador de p, donde 
X, el número de éxitos muéstrales, tenía una distribución binomial con parámetros n y p. Por 
lo tanto, 

E(p) = e(~ ) = - E(X) = - (np) = p 
\n n n 


PROPOSICIÓN 


Cuando X es una variable aleatoria binomial con parámetros n y p, la proporción 
muestral p = Xln es un estimador insesgado de p. 


No importa cuál sea el valor verdadero de p, la distribución del estimador p estará centrada 
en el valor verdadero. 
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Ejemplo 6.4 Suponga que X, el tiempo de reacción a un estímulo, tiene una distribución uniforme en el 
intervalo desde 0 hasta un límite superior desconocido 9 (por tanto la función de densidad 
de X es rectangular con altura 1 19 en el intervalo 0 < x s 9). Se desea estimar 9 con base 
en una muestra aleatoria X { , X 2 , . . . , X n de los tiempos de reacción. Como 9 es el tiempo 
más grande posible en toda la población de tiempos de reacción, considere como un primer 
estimador el tiempo de reacción muestral más grande 9¡ = máx(2£j, . . . , X n ). Si n = 5 y 
x¡ = 4.2, x 2 = 1.7, x 3 = 2.4, x 4 = 3.9, x 5 = 1.3, la estimación puntual de 9 es 9¡ = máx(4.2, 
1.7, 2.4, 3.9, 1.3) = 4.2. 

El insesgamiento implica que algunas muestras darán estimaciones que exceden 9 y 
otras que darán estimaciones más pequeñas que 9, de lo contrario 9 posiblemente no podría 
ser el centro (punto de equilibrio) de la distribución de 9 V Sin embargo, el estimador pro¬ 
puesto nunca sobrestimará 9 (el valor muestral más grande no puede exceder el valor de la 
población más grande) y subestimará 9 a menos que el valor muestral más grande sea igual 
a 9. Este argumento intuitivo demuestra que 0, es un estimador sesgado. Más precisamente, 
se puede demostrar (véase el ejercicio 32) que 

E(9,) = —• 9 < 9 ( como —< 1 

n + 1 y n + 1 

n9/(n + 1) — 9 = —9/(n + 1) da el sesgo de 9 ¡ . el cual tiende a 0 a medida que n se hace 
grande. 

Es fácil modificar 0¡ para obtener un estimador insesgado de 9. Considere el estimador 

9 , = • máxtXj, ...,X n ) 

n 

Utilizando este estimador en los datos se obtiene la estimación (6/5)(4.2) = 5.04. El hecho 
de que ( n + 1 )/n > 1 implica que 9 2 sobrestimará 9 con algunas muestras y subestimará 
otras. El valor medio de este estimador es 


E(9 2 ) = E 


n + 1 


máx(X 1; . . . , X n ) 


n + 1 
n 


n 

n + 1 


9 = 9 


• £[máx(Aj, . . . , X„)] 
n 


Si 0, se utiliza repetidamente en diferentes muestras para estimar 9, algunas estimaciones 
serán demasiado grandes y otras demasiado pequeñas, pero a la larga no habrá ninguna ten¬ 
dencia simétrica a subestimar o sobreestimar 9. ■ 



Principio de estimación insesgada 

Cuando se elige entre varios estimadores diferentes de 9, se elige uno insesgado. 


De acuerdo con este principio, el estimador insesgado 9 2 en el ejemplo 6.4 deberá ser 
preferido al estimador sesgado Ó,. Considérese ahora el problema de estimar cr 2 . 


PROPOSICIÓN 


Sean X { , X 2 , . . . , X n una muestra aleatoria de una distribución con media ¡jl y varian- 
za cr 2 . Entonces el estimador 

& , = ¡ r = Zy L - ll 

n — 1 

es un estimador insesgado de a 2 . 
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Ejemplo 6.5 
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Comprobación Para cualquier variable aleatoria Y, V(Y) = E(Y 2 ) — [£(E)] 2 , por lo tanto 
E(Y 2 ) = V(Y) + \E(Y)} 2 . Aplicando esto a 


se obtiene 


E(S 2 ) 


S 2 




&;) 2 1 


—r \Ze(X 2 ) - - £T(2>,) 2 ]] 
n - 1 [ n J 

—r \l(<T 2 + ti 2 ) - - (E(I>,) + [£(Xx,.)] 2 } 

—-— íncr 2 + n¡x 2 —— ncr 2 —— (n/x ) 2 
n — 1 [ n n 


-{ncr 2 — cr 2 } = cr 2 (como se desea) ■ 

n — 1 


El estimador que utiliza el divisor n se expresa como (n — 1 )S 2 /n, por lo tanto 


E 


(n - 1)S 2 ~ 
n 


n ~ 1 n - 1 , 

- E(S 2 ) = -cr 2 

n n 


Este estimador es por consiguiente sesgado. El sesgo es (n — l)cr 2 /n — cr 2 = -cr 2 ln. Como 
el sesgo es negativo, el estimador con divisor n tiende a subestimar cr y por eso muchos 
estadísticos prefieren el divisor n — 1 (aunque cuando n es grande, el sesgo es pequeño y 
hay poca diferencia entre los dos). 

Aun cuando S 2 es insesgado para cr 2 , S es un estimador sesgado de cr (su sesgo 
es pequeño a menos que n sea bastante pequeño). Sin embargo, existen otras buenas 
razones para utilizar S como estimador, en especial cuando la distribución de la población 
es normal. Estas se volverán más aparentes cuando se discutan los intervalos de confianza 
y la prueba de hipótesis en los siguientes capítulos. 

En el ejemplo 6.2, se propusieron varios estimadores diferentes de la media ¡x de una 
distribución normal. Si hubiera un estimador insesgado único para ¡i, el problema de esti¬ 
mación se resolvería utilizando dicho estimador. Desafortunadamente, éste no es el caso. 



Si X v X 2 , ... ,X n es una variable aleatoria tomada de una distribución con media /j., 
entonces X es un estimador insesgado de ¡x. Si además la distribución es continua y 
simétrica, entonces X y cualquier media recortada también son estimadores insesga¬ 
dos de [x. 


El hecho de que X sea insesgado es simplemente un replanteamiento de una de las reglas de 
valor esperado: E(X) =/x con cada valor posible de ¡x (para distribuciones discretas y con¬ 
tinuas). El insesgamiento de los demás estimadores es más difícil de verificar. 

El siguiente ejemplo introduce otra situación en la cual existen varios estimadores 
insesgados para un parámetro particular. 

En ciertas circunstancias contaminantes, orgánicos se adhieren con facilidad a las superfi¬ 
cies de obleas y deterioran los dispositivos de fabricación de semiconductores. El artículo 
“Ceramic Chemical Filter for Removal of Organic Contaminants” (J. of the Institute of 
Environmental Sciences and Technology, 2003: 59-65) discutió una alternativa reciente¬ 
mente desarrollada de filtros de carbón convencionales para eliminar contaminación 
molecular transportada por el aire en aplicaciones de cuartos limpios. Un aspecto de la 
investigación del desempeño de filtros implicó estudiar cómo se relaciona la concentración 
de contaminantes en aire con la concentración en las superficies de obleas después de una 
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exposición prolongada. Considere los siguientes datos representativos de x = concentración 
de DBP en aire y y = concentración de DBP en la superficie de obleas luego de 4 horas de 
exposición (ambas en fig/m 1 , donde DBP = ftalato de dibutilo). 

Obs. ¿.-1 2 3 4 5 6 

x: 0.8 1.3 1.5 3.0 11.6 26.6 

y: 0.6 1.1 4.5 3.5 14.4 29.1 

Los autores comentan que la “adhesión de DBP en la superficie de obleas fue aproximada¬ 
mente proporcional a la concentración de DBP en aire”. La figura 6.2 muestra una gráfica 
de y contra x, es decir, de los pares (x, y). 


Ftalato de dibutilo en oblea 

30- • 


25- 


20 - 


15- 




10 - 




Ftalato de 
dibutilo en aire 


Figura 6.2 Gráfica de los datos de ftalato de dibutilo del ejemplo 6.5. 


Si v fuera exactamente proporcional a x, se tendría y = fix con algún valor de /3, la cual expre¬ 
sa que los puntos (x, y) en la gráfica quedarían exactamente sobre una línea recta con pendien- 
de /3, que pasa por (0, 0). Pero es sólo aproximadamente el caso. Así que a continuación se 
supone que con cualquier x fija, la concentración de DBP en las obleas es una variable aleato¬ 
ria Y con valor medio fix. Es decir, se postula que el valor medio de Y está relacionado con x 
por una línea que pasa por (0, 0) pero que el valor observado de Y en general se desviará de esta 
línea (esto se conoce en la literatura estadística como “regresión a través del origen”). 

Ahora se desea estimar el parámetro de la pendiente ¡3. Considere los siguientes tres 
estimadores: 

#1: /§ = — X— #2: j3 = #3: ¡3 = — X>Y ' 

n x ' 2 >, £x? 

Las estimaciones resultantes basadas en los datos dados son 1.3497, 1.1875 y 1.1222, res¬ 
pectivamente. Así que de manera definitiva la estimación depende de qué estimador se uti¬ 
lice. Si uno de estos tres estimadores fuera insesgado y los otros dos sesgados, habría un 
buen motivo para utilizar el insesgado. Pero los tres son insesgados; el argumento se apoya 
en el hecho de que cada uno es una función lineal de las Y¡ (aquí se supone que las x¡ son 
fijas, no aleatorias): 
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Tanto en el ejemplo anterior como en la situación que implica estimar una media de pobla¬ 
ción normal, el principio de insesgamiento (prefiere un estimador insesgado a uno sesgado) 
no puede ser invocado para seleccionar un estimador. Lo que ahora se requiere es un crite¬ 
rio para elegir entre estimadores insesgados. 

Estimadores con varianza mínima 

Supóngase que 9¡ y 0 2 son dos estimadores de 0 insesgados. Entonces, aunque la distribu¬ 
ción de cada estimador esté centrada en el valor verdadero de 6, las dispersiones de las dis¬ 
tribuciones en torno al valor verdadero pueden ser diferentes. 


Principio de estimación insesgada con varianza mínima 

Entre todos los estimadores de 0 insesgados, se selecciona el de varianza mínima. El 

6 resultante se llama estimador insesgado con varianza mínima (EIYM) de 6. 


La figura 6.3 ilustra las funciones de densidad de probabilidad de los dos estimadores 
insesgados, donde 6 l tiene una varianza más pequeña que 9 2 . Entonces es más probable que 0, 
produzca una estimación próxima al valor verdadero 9 que 9 2 . El estimador insesgado con 
varianza mínima es, en cierto sentido, el que tiene más probabilidades entre todos los esti¬ 
madores insesgados de producir una estimación cercana al verdadero 9. 


7 

\ . , . A 

^ Función de densidad de probabilidad de 6 ^ 

7 1 

Función de densidad de probabilidad áef) 2 


Figura 6.3 Gráficas de las funciones de densidad de probabilidad de dos estimadores 
insesgados diferentes. 


En el ejemplo 6.5, supóngase que cada Y¡ está normalmente distribuida con media ¡3x¡ y va¬ 
rianza cr 2 (la suposición de varianza constante). Entonces se puede demostrar que el tercer 
estimador ¡3 = Y.x¡ Y¡/^x 2 ¡ no sólo tiene una varianza más pequeña que cualquiera de los 
otros dos estimadores insesgados, sino que de hecho es el estimador insesgado con varian¬ 
za mínima, tiene una varianza más pequeña que cualquier otro estimador insesgado de ¡3. 

Ejemplo 6.6 En el ejemplo 6.4 se argumentó que cuando X h . . . , X n es una variable aleatoria tomada de 
una distribución uniforme en el intervalo [0, 0], el estimador 

6 1 = rL ^~ • máx(Aj, ...,X n ) 
n 

es insesgado para 9 (previamente este estimador se denotó por 9 2 ). Este no es el único esti¬ 
mador insesgado de 9. El valor esperado de una variable aleatoria uniformemente distribuida 
es simplemente el punto medio del intervalo de densidad positiva, por lo tanto E(X¡) = 912. Es¬ 
to implica que E(X) = 9/2, a partir de la cual E(2X) = 9. Es decir, el estimador 9 2 = 2X es in¬ 
sesgado para 9. 

Si X está uniformemente distribuida en el intervalo A, B, en ese caso V(X) = cr 2 = 
(B — A) 2 / 12. Así pues, en esta situación, V(X¡) = 9 2 / 12, V(X) = cr 2 ln = 9 2 /{\2n) y 
V (§ 2 ) = V(2X) = 4V(X) = 9 2 /(3n). Se pueden utilizar los resultados del ejercicio 32 para 
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demostrar que V(0 ¡) = 6 2 /[n(n + 2)]. El estimador 0, tiene una varianza más pequeña que 
§ 2 si 3 n < n(n + 2), es decir, si 0 < n 2 — n = n(n — 1). En tanto n > 1, V(Ó ¡) < V(0 2 ), así 
que0 t es mejor estimador que 0 2 . Se pueden utilizar métodos más avanzados para demos¬ 
trar que 0 es el estimador insesgado con varianza mínima de 0, cualquier otro estimador 
insesgado de 6 tiene una varianza que excede 0 2 /[n(n + 2)]. ■ 

Uno de los triunfos de la estadística matemática ha sido el desarrollo de una metodo¬ 
logía para identificar el estimador insesgado con varianza mínima en una amplia variedad 
de situaciones. El resultado más importante de este tipo para nuestros propósitos tiene que 
ver con la estimación de la media /x de una distribución normal. 


TEOREMA 


Sean X u . . . , X n una muestra aleatoria tomada de una distribución normal con pará¬ 
metros fji y a. Entonces el estimador /x = X es el estimador insesgado con varianza 
mínima para /x. 



Siempre que exista la seguridad de que la población que se está muestreando es normal, el 
resultado dice que X debería usarse para estimar /x. Entonces, en el ejemplo 6.2 la estima¬ 
ción sería IT = 27.793. 

En algunas situaciones, es posible obtener un estimador con sesgo pequeño que se 
preferiría al mejor estimador insesgado. Esto se ilustra en la figura 6.4. Sin embargo, los 
estimadores insesgados con varianza mínima a menudo son más fáciles de obtener que el 
tipo de estimador sesgado cuya distribución se ilustra. 



Función de densidad de probabilidad 
de un estimador sesgado 

Función de densidad de probabilidad 
de 6 2 , el estimador insesgado con varianza mínima 


Figura 6.4 Un estimador sesgado que es preferible al estimador insesgado con varianza mínima. 


Algunas complicaciones 

El último teorema no dice que al estimar la media ¡± de una población, se deberá utilizar el 
estimador X independientemente de la distribución que se está muestreando. 


Ejemplo 6.7 Suponga que se desea estimar la conductividad térmica /x de un material. Con técnicas de 
medición estándar, se obtendrá una muestra aleatoria X { , . . . , X n de n mediciones de con¬ 
ductividad térmica. Suponga que la distribución de la población es un miembro de una de 
las siguientes tres familias: 


m 

f(x) 

m 


- ¿,-(x-IL) 2 /(2(T 2 ) 

V27TCT 2 

1 

7T[1 + (x ~ /x) 2 ] 

J_ 

' 2c 

o 


-oo < x < °° 


-00 < X < 00 


-c < X - /X < c 
de lo contrario 


( 6 . 1 ) 

( 6 . 2 ) 

(6.3) 
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La función de densidad de probabilidad (6.1) es la distribución normal, (6.2) se llama distri¬ 
bución de Cauchy y (6.3) es una distribución uniforme. Las tres distribuciones son simétricas 
con respecto a p y de hecho la distribución de Cauchy tiene forma de campana pero con 
colas muchos más gruesas (más probabilidad hacia fuera) que la curva normal. La distribu¬ 
ción uniforme no tiene colas. Los cuatro estimadores de p considerados con anterioridad son 
X, X , X e (el promedio de las dos observaciones extremas) y X rec(W) , una media recortada. 

La muy importante moraleja en este caso es que el mejor estimador de p depende cru¬ 
cialmente de qué distribución está siendo muestreada. En particular, 

1. Si la muestra aleatoria proviene de una distribución normal, en ese caso X es el mejor 
de los cuatro estimadores, puesto que tiene una varianza mínima entre todos los estima¬ 
dores insesgados. 

2. Si la muestra aleatoria proviene de una distribución de Cauchy, entonces X y X e son esti¬ 
madores terribles de ¡jl , en tanto que X es bastante bueno (el estimador insesgado con 
varianza mínima no es conocido); X es malo porque es muy sensible a las observacio¬ 
nes subyacentes y las colas gruesas de la distribución de Cauchy hacen que sea impro¬ 
bable que aparezcan tales observaciones en cualquier muestra. 

3. Si la distribución subyacente es uniforme, el mejor estimador es X e \ este estimador está 
influido en gran medida por las observaciones subyacentes, pero la carencia de colas 
hace que tales observaciones sean imposibles. 

4. En ninguna de estas tres situaciones es mejor la media recortada pero funciona razo¬ 

nablemente bien en las tres. Es decir, A' rec(¡(l . no sufre demasiado en comparación con el 
mejor procedimiento en cualquiera de las tres situaciones. ■ 

Investigaciones recientes en estadística han establecido que cuando se estima un punto 
de simetría p de una distribución de probabilidad continua, una media recortada con pro¬ 
porción de recorte de 10 o 20% (de cada extremo de la muestra) produce estimaciones 
razonablemente comportadas dentro de un rango muy amplio de posibles modelos. Por 
esta razón, se dice que una media recortada con poco porcentaje de recorte es un estima¬ 
dor robusto. 

En algunas situaciones, la selección no es entre dos estimadores diferentes construi¬ 
dos con la misma muestra, sino entre estimadores basados en dos experimentos distintos. 

Suponga que cierto tipo de componente tiene una distribución de vida útil exponencial con 
parámetro A de modo que la vida útil esperada es p = 1/A. Se selecciona una muestra de n 
de esos componentes y cada uno es puesto en operación. Si el experimento continúa hasta 
que todas las n vidas útiles, X¡, . . . , X n han sido observadas, en ese caso X es un estimador 
insesgado de p. 

En algunos experimentos, sin embargo, los componentes se dejan en operación sólo 
hasta el tiempo de la r-ésima falla, donde r < n. Este procedimiento se conoce como cen¬ 
sura. Sea Y l el tiempo de la primera falla (la vida útil mínima entere los n componentes) y 
Y 2 el tiempo en el cual ocurre la segunda falla (la segunda vida útil más pequeña), y así suce¬ 
sivamente. Como el experimento termina en el tiempo Y r , la vida útil acumulada al final es 

T r = ¿ Y¡ + (n - r)Y r 

i = 1 

A continuación se demuestra que jl = TJr es un estimador insesgado de p. Para hacerlo, se 
requieren dos propiedades de variables exponenciales. 

1. La propiedad de amnesia (véase la sección 4.4), dice que cualquier punto de tiempo, la 
vida útil restante tiene la misma distribución exponencial que la vida útil original. 

2. Si Xj, . ... X t son independientes, cada exponencial con parámetro A, entonces mín 
(Xj, . . . , X k ) es exponencial con parámetro k\ y su valor esperado es 1/(AA). 
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Como los n componentes duran hasta Y¡, n — 1 duran una cantidad de tiempo adicional 
Y 2 — Y 1 adicional y n — 2, duran una cantidad de tiempo Y 3 — Y 2 adicional, y así sucesiva¬ 
mente, otra expresión para T r es 

T r = nY j +(n~ 1 )(Y 2 - F,) + (n - 2)(F 3 ~ YJ + ■ ■ ■ 

+ (n - r + l)(F r - F r _,) 

Pero Fj es el mínimo de n variables exponenciales, por tanto E(Y ; ) = 1/(hA). Asimismo, 
F 2 — F¡ es la más pequeña de las n — 1 vidas útiles restantes, cada exponencial con 
parámetro A (según la propiedad de amnesia), así que E(Y 2 — Y { ) = 1 /[(« — 1)A], 
Continuando, E(Y ¡+1 — Y¡) = !/[(« — ¿)A], así que 


E(T r ) = nE(Y\) + (n- 1 )E(Y 2 - Y,)+■■■ +(n - r + 1 )E{Y r - Y r _ { ) 

1 


= n • ——f (n — 1) •--- 

nX (n - 1)A 


+ ■•■ + (« — r + 1) 


(n — r + 1)A 


r 

X 


Por consiguiente, E(T r /r ) = (1 /r)E(T r ) = (1/r) • (r/A) = 1/A =¡± como se dijo. 

Como un ejemplo, supónganse que se prueban 20 componentes y r = 10. Entonces 
si los primeros diez tiempos de falla son 11, 15, 29, 33, 35, 40, 47, 55, 58 y 72, la estima¬ 
ción de ju es 

11 + 15 + • • • + 72 + (10)(72) , ., . 

^ 10 


La ventaja del experimento con censura es que termina más rápido que el experimen¬ 
to sin censura. Sin embargo, se puede demostrar que V(T r /r) = 1/(A 2 r), la cual es más gran¬ 
de que l/(A 2 n), la varianza de X en el experimento sin censura. ■ 


Reporte de una estimación puntual: el error estándar 

Además de reportar el valor de una estimación puntual, se debe dar alguna indicación de su 
precisión. La medición usual de precisión es el error estándar del estimador usado. 


DEFINICIÓN 


El error estándar de un estimador § es su desviación estándar erg = V V(0). Si el error 
estándar implica parámetros desconocidos cuyos valores pueden ser estimados, la 
sustitución de estas estimaciones en erg da el error estándar estimado (desviación 
estándar estimada) del estimador. El error estándar estimado puede ser denotado o por 
(jg (el A sobre er recalca que erg está siendo estimada) o por Sg. 


Ejemplo 6.9 

(continuación 
del ejemplo 
6 . 2 ) 


Suponiendo que el voltaje de ruptura está normalmente distribuido, jx es la mejor esti¬ 
mación de ix. Si se sabe que el valor de cr es 1.5, el error estándar de X es tr^ = ertxfn = 
1.5/V2Ó = 0.335. Si, como casi siempre es el caso, el valor de er es desconocido, la esti¬ 
mación & = s = 1.462 se sustituye en o - y para obtener el error estándar estimado cry = 
s% = s/Vn = 1.462/V20 = 0.327. ■ 


Ejemplo 6.10 

(continuación 
del ejemplo 
6 . 1 ) 


El error estándar de p = XIii es 



Como p y q = 1 — p son desconocidas (¿de otro modo por qué estimar?), se sustituye p = 
x/n y q = 1 — x/n en cr¡, para obtener el error estándar estimado cr- = X/pqln = 
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V(0.6)(0.4)/25 = 0.098. Alternativamente, como el valor más grande de pq se obtiene 
cuando p = q = 0.5, un límite superior en el error estándar es V 1/(4 n) = 0.10. ■ 

Cuando la distribución del estimador puntual 9 es normal de modo aproximado, lo que 
a menudo será el caso cuando n es grande, en tal caso se puede estar confiado de manera razo¬ 
nable en que el valor verdadero de 0 queda dentro de aproximadamente dos errores estándar 
(desviaciones estándar) de 6. De este modo si una muestra de n = 36 vidas útiles de com¬ 
ponentes da fL = x = 28.50 y s = 3.60, por consiguiente, s/Vn = 0.60 dentro de dos erro¬ 
res estándar estimados de p se transforma en el intervalo 28.50 ± (2)(0.60) = (27.30, 29.70). 

Si 9 no es necesariamente normal en forma aproximada pero es insesgado, entonces 
se puede demostrar que la estimación se desviará de 9 hasta por cuatro errores estándar 
cuando mucho 6% del tiempo. Se esperaría entonces que el valor verdadero quede dentro 
de cuatro errores estándar de 9 (y ésta es proposición muy conservadora, puesto que se apli¬ 
ca a cualquier 9 insesgado). Resumiendo, el error estándar indica de forma aproximada a 
qué distancia de 9 se puede esperar que quede el valor verdadero de 9. 

La forma del estimador de 9 puede ser suficientemente complicado de modo que la 
teoría estadística estándar no pueda ser aplicada para obtener una expresión para cr g . Esto es 
cierto, por ejemplo, en el caso 9 = cr, 9 = S, la desviación estándar del estadístico S, cr s , en 
general no puede ser determinada. No hace mucho, se introdujo un método de computado¬ 
ra intensivo llamado bootstrap para abordar este problema. Supóngase que la función de 
densidad de probabilidad de la población es /(x; 9 ), un miembro de una familia paramétrica 
particular y que los datos x,, x 2 , . . . , x n dan 9 = 21.7. Ahora se utiliza la computadora para 
obtener “muestras bootstrap” tomadas de la función de densidad de probabilidad/(x; 21.7) 
y por cada muestra se calcula una “estimación bootstrap” 9*\ 

Primera muestra “bootstrap”: x*, x*, ... , x*; estimación = 9 j 

Segunda muestra “bootstrap”: x*, x% ... , x*; estimación =0* 



5-ésima muestra bootstrap: x*, x*,... , x*; estimación =6 1 

A menudo se utiliza B = 100 o 200. Ahora sea 9* = Yfi*/B, la media muestral de las esti¬ 
maciones “bootstrap”. La estimación bootstrap del error de estándar de las 9 ahora es sim¬ 
plemente la desviación estándar muestral de las 9 *: 

s o = ~ 9 *) 2 

(En la literatura de bootstrap, a menudo se utiliza B en lugar de B — 1; con valores típicos 
de B, casi siempre hay poca diferencia entre las estimaciones resultantes.) 


Ejemplo 6.11 

Un modelo teórico sugiere que X, el tiempo para la ruptura de un fluido aislante entre elec¬ 
trodos a un voltaje particular, tiene/(x; A) = \e~ kx , una distribución exponencial. Una mues¬ 
tra aleatoria de n = 10 tiempos de ruptura (min) da los datos siguientes: 

41.53 18.73 2.99 30.34 12.33 117.52 73.02 223.63 4.00 26.78 

Como E(X) = 1/A, E(X) = 1/A, una estimación razonable de A es A = 1/x = 1/55.087 = 
0.018153. Se utilizaría entonces un programa de computadora para obtener B = 100 mues¬ 
tras bootstrap, cada una de tamaño 10, provenientes de /(x; .018153). La primera muestra 
fue 41.00, 109.70, 16.78, 6.31, 6.76, 5.62, 60.96, 78.81, 192.25, 27.61, con la cual 
£x* = 545.8 y Á* = 1/54.58 = 0.01832. El promedio de 100 estimaciones bootstrap es 
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A* = 0.02153 y la desviación estándar muestral de estas 100 estimaciones es s ¡f = 0.0091. 
La estimación bootstrap del error estándar de A. Un histograma de los 100A* resultó un tan¬ 
to positivamente asimétrico lo que sugiere que la distribución muestral de A también tiene 
esta propiedad. ■ 

En ocasiones un investigador desea estimar una característica poblacional sin suponer 
que la distribución de la población pertenece a una familia paramétrica particular. Una ins¬ 
tancia de esto ocurrió en el ejemplo 6.7, cuando una media 10% recortada fue propuesta 
para estimar el centro 0 de la distribución de la población simétrica. Los datos del ejemplo 
6.2 dieron 0 = 7 rec(IOj = 27.838 pero ahora no hay ninguna/(.r; 6) supuesta, por consiguiente 
¿cómo se puede obtener una muestra bootstrap? La respuesta es considerar la muestra como 
que constituye la población (las n = 20 observaciones en el ejemplo 6.2) y considerar B 
muestras diferentes, cada una de tamaño n, con reemplazo de esta población. El libro de 
Bradley Efron y Robert Tibshirani o el de John Rice incluidos en la bibliografía del capítu¬ 
lo proporcionan más información. 


EJERCICIOS Sección 6.1 (1-19) 


1. Los datos adjuntos sobre resistencia a la flexión (MPa) de 
vigas de concreto de un tipo se introdujeron en el ejemplo 1.2. 


5.9 

7.2 

7.3 

6.3 

8.1 

6.8 

7.0 

7.6 

6.8 

6.5 

7.0 

6.3 

7.9 

9.0 

8.2 

8.7 

7.8 

9.7 

7.4 

7.7 

9.7 

7.8 

7.7 

11.6 

11.3 

11.8 

10.7 



a. Calcule una estimación puntual del valor medio de resis¬ 
tencia de la población conceptual de todas las vigas 
fabricadas de esta manera y diga qué estimador utilizó: 
[Sugerencia: Y.x¡ = 219.8.] 

b. Calcule una estimación puntual del valor de resistencia 
que separa el 50% más débil de dichas vigas del 50% 
más resistente y diga qué estimador se utilizó. 

c. Calcule e interprete una estimación puntual de la des¬ 
viación estándar de la población a. ¿Qué estimador uti¬ 
lizó? [Sugerencia: 2jc¡ = 1860.94.] 

d. Calcule una estimación puntual de la proporción de las 
vigas cuya resistencia a la flexión exceda de 10 MPa. 
[Sugerencia: Considere una observación como “éxito” si 
excede de 10.] 

e. Calcule una estimación puntual del coeficiente de varia¬ 
ción de la población cr/p, y diga qué estimador utilizó. 

2. Una muestra de 20 estudiantes que recientemente tomaron un 
curso de estadística elemental arrojó la siguiente información 
sobre la marca de calculadora que poseían. (T = Texas 
Instruments, H = Hewlett Packard, C = Casio, S = Sharp): 

TTHTCTTSCH 

SSTHCTTTHT 

a. Estime la proporción verdadera de los estudiantes que 
poseen una calculadora Texas Instruments. 

b. De los 10 estudiantes que poseían una calculadora TI. 4 
tenían calculadoras con graficación. Estime la propor¬ 


ción de estudiantes que no poseen una calculadora con 
graficación TI. 

3. Considere la siguiente muestra de observaciones sobre 
espesor de recubrimiento de pintura de baja viscosidad 
(“Achieving a Target Valué for a Manufacturing Process: A 
Case Study”, J. ofQuality Technology , 1992: 22-26): 

0.83 0.88 0.88 1.04 1.09 1.12 1.29 1.31 
1.48 1.49 1.59 1.62 1.65 1.71 1.76 1.83 

Suponga que la distribución del espesor de recubrimiento es 
normal (una gráfica de probabilidad normal soporta fuerte¬ 
mente esta suposición). 

a. Calcule la estimación puntual de la mediana del espesor 
de recubrimiento y diga qué estimador utilizó. 

b. Calcule una estimación puntual de la mediana de la dis¬ 
tribución del espesor de recubrimiento y diga qué esti¬ 
mador utilizó. 

c. Calcule la estimación puntual del valor que separa el 
10% más grande de todos los valores de la distribución 
del espesor del 90% restante y diga qué estimador utili¬ 
zó. [Sugerencia: Exprese lo que está tratando de estimar 
en función de ¿i y o\] 

d. Estime P(X < 1.5), es decir, la proporción de todos los 
valores de espesor menores que 1.5 [Sugerencia: Si 
conociera los valores de ¿i y cr podría calcular esta pro¬ 
babilidad. Estos valores no están disponibles, pero pue¬ 
den ser estimados.] 

e. ¿Cuál es el error estándar estimado del estimador que 
utilizó en el inciso b)? 

4. El artículo del cual se extrajeron los datos en el ejercicio 1 
también dio las observaciones de resistencias adjuntas de 
cilindros: 

6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3 

7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2 
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Antes de obtener los datos, denote las resistencias de vigas 
mediante 3£j,..., X m y Y v ... ,Y n las resistencias de cilindros. 
Suponga que las X¡ constituyen una muestra aleatoria de 
una distribución con media /x¡ y desviación estándar <x 1 y 
que las Y¡ forman una muestra aleatoria (independiente de 
las X¡) de otra distribución con media ¡jl 2 Y desviación están¬ 
dar cr 2 . 

a. Use las reglas de valor esperado para demostrar que 
X — Y es un estimador insesgado de /. i, — ¿i,. Calcule la 
estimación con los datos dados. 

b. Use las reglas de varianza del capítulo 5 para obtener 
una expresión para la varianza y desviación estándar 
(error estándar) del estimador del inciso a) y luego calcule 
el error estándar estimado. 

c. Calcule una estimación puntual de la razón o-j/cr, de las 
dos desviaciones estándar. 

d. Suponga que se seleccionan al azar una sola viga y un 
solo cilindro. Calcule una estimación puntual de la va¬ 
rianza de la diferencia X — Y entre la resistencia de las 
vigas y la resistencia de los cilindros. 

5. Como ejemplo de una situación en la que varios estadísti¬ 
cos diferentes podrían ser razonablemente utilizados para 
calcular una estimación puntual, considere una población 
de N facturas. Asociado con cada factura se encuentra su 
“valor en libros”, la cantidad anotada de dicha factura. Sea 
T el valor en libros total, una cantidad conocida. Algunos de 
estos valores en libros son erróneos. Se realizará una audito¬ 
ría seleccionando al azar n facturas y determinando el valor 
auditado (correcto) para cada una. Suponga que la muestra da 
los siguientes resultados (en dólares). 


Factura 



1 

2 

3 

4 

5 

Valor en libros 

300 

720 

526 

200 

127 

Valor auditado 

300 

520 

526 

200 

157 

Error 

0 

200 

0 

0 

-30 


Sea 

Y = valor en libros medio muestral 
X = valor auditado medio muestral 
D = error medio muestral 

Proponga tres estadísticos diferentes para estimar el valor 
total (correcto) auditado: uno que implique exactamente N y 
X, otro que implique T, N y D y el último que implique T 
y X/Y. Si N = 5000 y T = 1761300, calcule las tres estima¬ 
ciones puntuales correspondientes. (El artículo “Statistical 
Models and Analysis in Auditing”, Statistical Science, 1989: 
2-33, discute propiedades de estos tres estimadores.) 

6. Considere las observaciones adjuntas sobre el flujo de una 
corriente de agua (miles de acres-pies) registradas en una esta¬ 
ción en Colorado durante el periodo del 1 de abril al 31 de 
agosto durante 31 años (tomadas de un artículo que apareció 
en el volumen 1974 de Water Resources Research). 
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127.96 

210.07 

203.24 

108.91 

178.21 

285.37 

100.85 

89.59 

185.36 

126.94 

200.19 

66.24 

247.11 

299.87 

109.64 

125.86 

114.79 

109.11 

330.33 

85.54 

117.64 

302.74 

280.55 

145.11 

95.36 

204.91 

94.33 

311.13 

150.58 

262.09 

477.08 


Una gráfica de probabilidad apropiada soporta el uso de la 

distribución lognormal (véase la sección 4.5) como modelo 

razonable de flujo de corriente de agua. 

a. Calcule los parámetros de la distribución [ Sugerencia: 
Recuerde que X tiene una distribución lognormal con 
parámetros /x y <x 2 si ln(X) está normalmente distribuida 
con media /x y varianza o -.] 

b. Use las estimaciones del inciso a) para calcular una esti¬ 
mación del valor esperado del flujo de corriente de agua 
[Sugerencia'. ¿Cuál es E(X)'l\ 

7. a. Se selecciona una muestra de 10 casas en un área particu¬ 

lar, cada una de las cuales se calienta con gas natural y se 
determina la cantidad de gas (termias) utilizada por cada 
casa durante el mes de enero. Las observaciones resultan¬ 
tes son 103,156,118, 89,125,147,122,109,138, 99. Sea 
jU el consumo de gas promedio durante enero de todas las 
casas del área. Calcule una estimación puntual de /x. 

b. Suponga que hay 10 000 casas en esta área que utilizan 
gas natural para calefacción. Sea t la cantidad total de gas 
consumido por todas estas casas durante enero. Calcule 
r con los datos del inciso a). ¿Qué estimador utilizó para 
calcular su estimación? 

c. Use los datos del inciso a) para estimar p, la proporción 
de todas las casas que usaron por lo menos 100 termias. 

d. Proporcione una estimación puntual de la mediana de la 
población usada (el valor intermedio en la población de 
todas las casas) basada en la muestra del inciso a). ¿Qué 
estimador utilizó? 

8. En una muestra aleatoria de 80 componentes de un tipo, se 

encontraron 12 defectuosos. 

a. Dé una estimación puntual de la proporción de todos los 
componentes que no están defectuosos. 

b. Se tiene que construir un sistema seleccionando al azar 
dos de estos componentes y conectándolos en serie, 
como se muestra a continuación. 


La conexión en serie implica que el sistema funcionará siem¬ 
pre y cuando ningún componente esté defectuoso (es decir, 
ambos componentes funcionan apropiadamente). Estime la 
proporción de todos los sistemas que funcionan de manera 
apropiada. [Sugerencia'. Si p denota la probabilidad de que el 
componente funcione apropiadamente, ¿cómo puede ser 
expresada P(el sistema funciona) en función de p?] 

9. Se examina cada uno de 150 artículos recién fabricados y se 
anota el número de rayones por artículo (se supone que los 
artículos están libres de rayones) y se obtienen los siguien¬ 
tes datos: 
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Número de 
rayones 

por artículo 0 1 2 3 4 5 6 7 

Frecuencia 

observada 18 37 42 30 13 7 2 1 

Sea X = el número de rayones en un artículo seleccionado 
al azar y suponga que X tiene una distribución de Poisson 
con parámetro A. 

a. Determine un estimador insesgado de A y calcule la esti¬ 
mación de los datos. [ Sugerencia: E(X) — A para una 
distribución Poisson de X, por lo tanto E(X) = ?] 

b. ¿Cuál es la desviación estándar (error estándar) de su 
estimador? Calcule el error estándar estimado. 
[, Sugerencia : o-f =A con distribución de Poisson de X.] 

10. Con una larga varilla de longitud p, va a trazar una curva 
cuadrada en la cual la longitud de cada lado es p. Por con¬ 
siguiente el área de la curva será p 2 . Sin embargo, no cono¬ 
ce el valor de p así que decide hacer n mediciones 
independientes X 2 , ... ,X n de la longitud. Suponga que 
cada X¡ tiene una media p (mediciones insesgadas) y 
varianza cr 2 . 

a. Demuestre que Al" no es un estimador insesgado de p 2 . 
[, Sugerencia: Con cualquier variable aleatoria Y, E(Y 2 ) = 
V{Y) + \E(Y)\ 2 . Aplique ésta con Y = X.\ 

b. ¿Con qué valor de k es el estimador X 2 — kS 2 insesgado 
para p 2 7 [Sugerencia'. Calcule E(X 2 — AS 2 ).] 

11. De n l fumadores seleccionados al azar, A' 1 fuman cigarrillos 
con filtro, mientras que de n 2 fumadoras seleccionadas al 
azar, AL, fuman cigarrillos con filtro. Sean p¡ y p 2 las proba¬ 
bilidades de que un varón y una mujer seleccionados al 
azar, fumen, respectivamente, cigarrillos con filtro. 

a. Demuestre que (Aj/flj) — (X 2 /n 2 ) es un estimador inses¬ 
gado de p i — p 2 . [Sugerencia: E(X¡) = n¡p¡ con i = 1, 2.] 

b. ¿Cuál es el error estándar del estimador en el inciso a)? 

c. ¿Cómo utilizaría los valores observados x 1 y x 2 para esti¬ 
mar el error estándar de su estimador? 

d. Si n l = n 2 = 200, x¡ = 127 y x, = 176, use el estimador 
del inciso a) para obtener una estimación de p 1 — p,. 

e. Use el resultado del inciso c) y los datos del inciso d) 
para estimar el error estándar del estimador. 

12. Suponga que un tipo de fertilizante rinde p 1 por acre con 
varianza cr 2 , mientras que el rendimiento esperado de un 
segundo tipo de fertilizante es p con la misma varianza a 2 
Sean S 2 y S 2 las varianzas muéstrales de rendimientos basa¬ 
das en tamaños muéstrales n¡ y n 2 , respectivamente, de los 
dos fertilizantes. Demuestre que el estimador combinado es 

(w, - 1)S 2 + (n 2 - l)Sj 
— n¡ + n 2 — 2 

es un estimador insesgado de cr 2 . 

13. Considere una muestra aleatoria de A' 1 , . . . , X n de la fun¬ 
ción de densidad de probabilidad 


donde — 1 < 0 < 1 (esta distribución se presenta en la física 
de partículas. Demuestre que 6 = 3A" es un estimador inses¬ 
gado de 6. [Sugerencia: Primero determine p = E(X) = E{X)Í] 

14. Una muestra de n aviones de combate Pandemónium cap¬ 
turados tienen los números de serie x¡, x 2 , x 3 , ... , x n . La 
CIA sabe que los aviones fueron numerados consecutivamen¬ 
te en la fábrica comenzando con a y terminando con j6, por lo 
que el número total de aviones fabricados es /3 — a + 1 
(p. ej., si a = 17 y /3 = 29, entonces 29 — 17 + 1 = 13 
aviones con números de serie 17, 18, 19,..., 28, 29 fueron 
fabricados). Sin embargo, la CIA no conoce los valores de 
uyj3. Un estadístico de la CIA sugiere utilizar el estimador 
máx(X¡) — mín(Aj.) + 1 para estimar el número total de 
aviones fabricados. 

a. Si n — 5, x 1 = 237, x 2 = 375, x 3 = 202, x 4 = 525 y 
x¡ = 418, ¿cuál es la estimación correspondiente? 

b. ¿En qué condiciones de la muestra será el valor de la esti¬ 
mación exactamente igual al número total verdadero de 
aviones? ¿Alguna vez será más grande la estimación que 
el total verdadero? ¿Piensa que el estimador es insesgado 
para estimar j6 + a + 1? Explique en una o dos oraciones. 

15. Si A'j, X 2 , . . . , X n representan una muestra aleatoria toma¬ 
da de una distribución de Rayleigh con función de densidad 
de probabilidad 

/(x; 6) = ^ e -Jt2/(2e) x > 0 

a. Se puede demostrar que ElX 2 ) = 26. Use este hecho 
para construir un estimador insesgado de 6 basado en 
Y.X 2 ¡ (y use reglas de valor esperado para demostrar que 
es insesgado). 

b. Calcule 6 a partir de las siguientes n = 10 observacio¬ 
nes de esfuerzo vibratorio de un aspa de turbina en con¬ 
diciones específicas: 

16.88 10.23 4.59 6.66 13.68 
14.23 19.87 9.40 6.51 10.95 

16. Suponga que el crecimiento promedio verdadero p de un tipo 
de planta durante un periodo de un año es idéntico al de un 
segundo tipo, aunque la varianza del crecimiento del primer 
tipo es o 2 , en tanto que para el segundo tipo, la varianza es 
4cr 2 . Sean A^,. . . , X m , m observaciones de crecimiento inde¬ 
pendientes del primer tipo [por consiguiente E(X¡) = p, V(X¡) 
= a 2 ] y sean Y lt , F„, n observaciones de crecimiento 
independientes del segundo tipo [E{Y¡) = p, V(Y¡) = Acr\. 

a. Demuestre que con cualquier S entre 0 y 1, el estimador 
p = SX + (1 — S)Y es insesgado para p. 

b. Con m y n fijas, calcule V(p) y luego determine el valor de 
8 que reduzca al mínimo V(p). [ Sugerencia: Derive V(p) 
con respecto a S.] 

17. En el capítulo tres, se definió una variable aleatoria bino- 
mial negativa como el número de fallas que ocurren antes 
del r-ésimo éxito en una secuencia de ensayos con éxitos y 
fallas independientes e idénticos. La función masa de pro¬ 
babilidad (fmp) de X es 

nb{x\ r, p) = 

(x + r — 1 \ 

)p r (l - pY x = 0,1,2,... 

0 de lo contrario 


/(jc; 6) = 0.5(1 + 6x) -1 < x < 1 


x 
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a. Suponga que ri 2. Demuestre que 

p = {r — 1 )l(X+r- 1) 

es un estimador insesgado de p. [ Sugerencia: Escriba 
E{P) y elimine x + r — 1 dentro de la suma.] 

b. Un reportero desea entrevistar a cinco individuos que 
apoyan a un candidato y comienza preguntándoles si (S) 
o no (F) apoyan al candidato. Si la secuencia de res¬ 
puestas es SFFSFFFSSS estiman p = la proporción ver¬ 
dadera que apoya al candidato. 

18. Sean X l , X 2 , . . . , X n una muestra aleatoria de una función 
de densidad de probabilidad j{x) simétrica con respecto a 
p, de modo que X sea un estimador insesgado de p. Si n es 
grande, se puede demostrar que V(X) ~ l/(4n[/(ju,)] 2 ). 

a. Compara V(X) con V(X) cuando la distribución subya¬ 
cente es normal. 

b. Cuando la función de densidad de probabilidad subya¬ 
cente es Cauchy (véase el ejemplo 6.7), V{X) = co por lo 
tanto X es un estimador terrible. ¿Cuál es V(X) en este 
caso cuando n es grande? 

19. Una investigadora desea estimar la proporción de estudian¬ 
tes en una universidad que han violado el código de honor. 
Habiendo obtenido una muestra aleatoria de n estudiantes, 
se da cuenta que si a cada uno le pregunta “¿Has violado el 
código de honor?” probablemente recibirá algunas respues- 
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tas faltas de veracidad. Considere el siguiente esquema, 
conocido de técnica de respuesta aleatorizada. La investi¬ 
gadora forma un mazo de 100 cartas de las cuales 50 son de 
tipo I y 50 de tipo H. 

Tipo I: ¿Has violado el código de honor (sí o no)? 

Tipo II: ¿Es el último dígito de su número telefónico un 0, 
1 o 2 (sí o no)? 

A cada estudiante en la muestra aleatoria se le pide que 
baraje el mazo, que saque una carta y que responda la pre¬ 
gunta con sinceridad. A causa de la pregunta irrelevante en 
las cartas de tipo II, una respuesta sí ya no estigmatiza a 
quien contesta, así que se supone que éste es sincero. Sea p 
la proporción de violadores del código de honor (es decir, la 
probabilidad de que un estudiante seleccionado al azar sea 
un violador) y sea A = P(respuesta sí). Entonces Ay p están 
relacionados por A = 0.5 p + (0.5)(0.3). 

a. Sea Y el número de respuestas sí, por consiguiente Y ~ 
Binfi?, A). Por tanto Yin es un estimador insesgado de A. 
Obtenga un estimador de p basado en Y. Si n — 80 y 
y = 20, ¿cuál es su estimación? [ Sugerencia: Resuelva 
A = 0.5 p + 1.5 para p y luego sustituya Yin en lugar de A.] 

b. Use el hecho de que E(Y/n) = A para demostrar que su 
estimador p es insesgado. 

c. Si hubiera 70 cartas de tipo I y 30 de tipo II, ¿cuál sería 
su estimador para p^ 


6.2 Métodos de estimación puntual 


La definición de insesgamiento no indica en general cómo se pueden obtener los estimadores 
insesgados. A continuación se discuten dos métodos “constructivos” para obtener estimado¬ 
res puntuales: el método de momentos y el método de máxima verosimilitud. Por constructi¬ 
vo se quiere dar a entender que la definición general de cada tipo de estimador sugiere 
explícitamente cómo obtener el estimador en cualquier problema específico. Aun cuando se 
prefieren los estimadores de máxima verosimilitud a los de momento debido a ciertas propie¬ 
dades de eficiencia, a menudo requieren significativamente más cálculo que los estimadores 
de momento. En ocasiones es el caso que estos métodos dan estimadores insesgados. 

El método de momentos 

La idea básica de este método es poder igualar ciertas características muéstrales, tales como 
la media, a los valores esperados de la población correspondiente. Luego resolviendo estas 
ecuaciones con valores de parámetros conocidos se obtienen los estimadores. 


DEFINICIÓN 


Si Xj, . . . , X n constituyen una muestra aleatoria proveniente de una función masa de 
probabilidad o de una función de densidad de probabilidad f(x). Con k = 1,2, 

3, ... el Ar-ésimo momento de la población o el A:-ésimo momento de la distribu¬ 
ción f(x), es E(X k ). El A>ésimo momento muestral es (l/n)E',' \X k . 


Por consiguiente el primer momento de la población es E(X) = p y el primer momento 
muestral es Y^XJn = X. Los segundos momentos de la población y muestral son F(X 2 ) y 
YjX 2 ¡ln, respectivamente. Los momentos de la población serán funciones de cualquier pará¬ 
metro desconocido 6 V 0 2 , ■ ■ ■ 






















CAPÍTULO 6 Estimación puntual 


DEFINICIÓN 


Ejemplo 6.12 


Ejemplo 6.13 


Ejemplo 6.14 


Si Aj, Aj, . . . , X n son una muestra aleatoria de una distribución con función masa de 
probabilidad o función de densidad de probabilidad flx\ 9 U . . . , 9 m ). donde 9 2 ,.. ., 9 m 
son parámetros cuyos valores son desconocidos. Entonces los estimadores de momen¬ 
to 9 { , . . . ,9 m se obtienen igualando los primeros m momentos muéstrales con los pri¬ 
meros m momentos de la población correspondientes y resolviendo para 9 V , 6 m . 


Si, por ejemplo, m = 2, E{X) y E(X 2 ) serán funciones de 9¡ y 9 2 . Con E(X) = {Un) J)X t 
(= X) y E(X 2 ) = (1 /n) Y.X) se obtienen dos ecuaciones en 0, y 0 2 . La solución define enton¬ 
ces los estimadores. Para estimar una media /r poblacional, el método da /j, = X, por lo 
tanto el estimador es la media muestral. 

Si X v X 2 , . .. ,X n representan una muestra aleatoria de tiempos de servicio de n clientes en 
una instalación, donde la distribución subyacente se supone exponencial con el parámetro A. 
Como sólo hay un parámetro que tiene que ser estimado, el estimador se obtiene igua¬ 
lando E{X) a X. Como E(X) = 1/A con una distribución exponencial, ésta da 1/A = X o 
A = l/X. El estimador de momento de A es entonces A = 1/A". ■ 


Sean Aj, . ... X n una muestra aleatoria de una distribución gama con parámetros a y /3. De 
acuerdo con la sección 4.4, E{X) =a[i y E(X 2 ) = p 2 T{a + 2)/E(a) = fí 2 (a + I ja. Los esti¬ 
madores de momento a y /3 se obtienen resolviendo 

X = a¡3 = a(a + l)/3 2 

n 

Como a(a + l)/3 2 = a 2 ¡3 2 + cx¡i 2 y la primera ecuación implica a 2 ¡3 2 = X 2 . la segunda 
ecuación se vuelve 

-ZX 2 = X 2 + afi 2 
n 


Ahora si se divide cada miembro de esta segunda ecuación entre el miembro correspon¬ 
diente de la primera ecuación y se sustituye otra vez se obtienen los estimadores 


x 2 


(1 /njZx 2 -X ¿ 1 3 ~ 


(1 /n)Zx 2 -X 2 

X 


Para ilustrar, los datos de tiempo de sobrevivencia mencionados en el ejemplo 4.24 son 

152 115 109 94 88 137 152 77 160 165 

125 40 128 123 136 101 62 153 83 69 

con x = 113.5 y (1/20)2^ = 14087.8. Los estimadores son 


a 


(113.5) 2 

14087.8 - (113.5) 2 


10.7 


14087.8 - (113.5) 2 

113.5 


10.6 


Estas estimaciones de a y p difieren de los valores sugeridos por Gross y Clark porque ellos 
utilizaron una técnica de estimación diferente. ■ 


Sean Aj, . ... X n una muestra aleatoria de una distribución binomial negativa generalizada 
con parámetros r y p (sección 3.5). Como E(X) = r( I — /;)//; y V(X) = r( I — p)/p 2 . 
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Ejemplo 6.15 
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E{X 2 ) = V(X) + [£(A)] 2 = r( 1 - p)(r - rp + 1 )/p 2 . Si se iguala E{X) a X y EiX 2 ) a 
(1 ¡n )XX] a la larga se obtiene 

X „ _ X _ 

P ~ (1 /n)Zx 2 -X 2 r ~ (mlx 2 -X 2 -X 

Como ilustración, Reep, Pollard y Benjamin (“Skill and Chance in Ball Games”, J. 
Royal Stat. Soc., 1971: 623-629) consideran la distribución binomial negativa como modelo 
del número de goles por juego anotados por los equipos de la Liga Nacional de Jockey. 
Los datos de 1966-1967 son los siguientes (420 juegos): 


Goles 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

Frecuencia 

29 

71 

82 

89 

65 

45 

24 

7 

4 

1 

3 


Entonces, 

x = XV420 = [(0)(29) + (1)(71) + • • • + (10)(3)]/420 = 2.98 


y 

I> 2 /420 = [(0) 2 (29) + (1) 2 (71) + • • • + (10) 2 (3)]/420 = 12.40 
Por consiguiente, 


P = 


2.98 


12.40 - (2.98) 2 


= 0.85 


(2.98) 2 


12.40 - (2.98) 2 - 2.98 


= 16.5 


Aunque r por definición debe ser positivo, el denominador de r podría ser negativo, lo que 
indica que la distribución binomial negativa no es apropiada (o que el estimador de momen¬ 
to es defectuoso). ■ 


Estimación de máxima verosimilitud 

El método de máxima probabilidad lo introdujo por primera vez R. A. Fisher, genetista y 
estadístico en la década de 1920. La mayoría de los estadísticos recomiendan este método, 
por lo menos cuando el tamaño de muestra es grande, puesto que los estimadores resultantes 
tienen ciertas propiedades de eficiencia deseables (véase la proposición en la página 249). 

Se obtuvo una muestra de diez cascos de ciclista nuevos fabricados por una compañía. Al 
probarlos, se encontró que el primero, el tercero y el décimo estaban agrietados, en tanto que 
los demás no. Sea p = Pícasco agrietado) y defina X u , X 10 como X¡ = 1 si el í-ésimo 
casco está agrietado y cero de lo contrario. En ese caso las x¡ son 1,0, 1, 0, 0, 0, 0, 0, 0, 1, 
así que la función masa de probabilidad conjunta de la muestra es 

/(-*,, x 2 ,..., x l0 ; p) = p{\ ~ p)p . p = p 3 ( 1 - p) 1 (6.4) 

Ahora se hace la pregunta, “¿Con qué valor de p es más probable que la muestra observada 
haya ocurrido?” Es decir, se desea encontrar el valor de p que incrementa al máximo la fun¬ 
ción masa de probabilidad (6.4) o, en forma equivalente, que incrementa al máximo el loga¬ 
ritmo natural de (6.4).* Como 

ln[/(x„ . . . , x 10 ; p)] = 3 \n(p) + 7 ln(l - p) (6.5) 



* Como ln[g(j*:)] es una función monotónica de g(x), determinar x para incrementar al máximo ln[g(x)] equivale a 
incrementar al máximo g(x). En estadística, si se toma el logaritmo con frecuencia, un producto cambia a una 
suma, con la cual es más fácil trabajar. 
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la cual es una función derivable de p, igualando la derivada de (6.5) a cero se obtiene el valor 
maximizante 1 ' 


-f W(* 1. • ■ •.*1»; p)] = ~- T 2 — = o 

dp p 1 - p 


P = 


3 _ x 
10 ~~ n 


donde x es el número de éxitos observados (cascos agrietados). La estimación de p ahora 
es p = -fg. Se llama estimación de máxima verosimilitud porque para x v ... , x 10 estable¬ 
cido, es el valor del parámetro que maximiza la probabilidad (función masa de probabili¬ 
dad conjunta) de la muestra observada. 

Obsérvese que si sólo se hubiera dicho que entre los diez cascos había tres agrietados, 
la ecuación (6.4) sería reemplazada por la función masa de probabilidad binomial 
(*3 )/x 3 ( 1 — p) 7 , la cual también se incrementa al máximo con p = ■ 



DEFINICIÓN 


Que X¡, X 2 , . ... X n tengan una función masa de probabilidad o una función de den¬ 
sidad de probabilidad 

f(x v x 2 , . . . , x„; G l .0J (6.6) 

donde los parámetros 0¡, .. ., 9 m tienen valores desconocidos. Cuando x¡,. . ., x„ son 
los valores muéstrales observados y (6.6) se considera como una función de 0¡,.. ., 0 ln , 
se llama función de verosimilitud. Las estimaciones de máxima verosimilitud (emv) 
0],... ,0 m son aquellos valores de las 0, que incrementan al máximo la función de pro¬ 
babilidad, de modo que 

/(Xj, • • . , x„;0j, . . . ,0J >f(x j, . . . , x„; 0 1; . . . , 0J con todos los 0 l5 . . . , 0 m 

Cuando se sustituyen las X¡ en lugar de las x¡, se obtienen los estimadores de máxi¬ 
ma verosimilitud. 



La función de verosimilitud dice qué tan probable es que la muestra observada sea una 
función de los posibles valores de parámetro. Al incrementarse al máximo la probabilidad 
se obtienen los valores de parámetro con los que la muestra observada es más probable que 
haya sido generada, es decir, los valores de parámetro que “más concuerdan” con los datos 
observados. 

Ejemplo 6.16 Suponga que Aj, X 2 , . . . , X n es una muestra aleatoria de una distribución exponencial con 
parámetro A. Debido a la independencia, la función de verosimilitud es un producto de las 
funciones de densidad de probabilidad individuales: 

/(x 1; . . . , x„; A) = (Ae~ Ax i).(Ae~ Ax «) = A"e~ AXx ¿ 

El ln(verosimilitud) es 


ln[/(Xj, . . ■ , x„; A)] = n ln(A) - xZx¡ 

Si se iguala (cl/dÁ /[ Infverosimilitud )] a cero se obtiene nJ A — Xx, = 0, o A = ní2 J x i = 1/x. 
Por consiguiente el estimador de máxima verosimilitud es A = 1/X; es idéntico al método de 
estimador de momentos [pero no es un estimador insesgado, puesto que E( I IX) A 1 !E(X)]. ■ 


t Esta conclusión requiere que se verifique la segunda derivada, pero se omiten los detalles. 
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Ejemplo 6.17 


Ejemplo 6.18 


e 
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Sean Aj, . . . , X n una muestra aleatoria de una distribución normal. La función de probabi¬ 
lidad es 


f(x v ■ ■ ■ , x„; ¡x, o- 2 ) = 


V27TCT' 


- e -(xi~ll) 2 l(2cr 2 ) , 


V27 TCT 2 


e -(x n ~li) 2 K2tr 2 ) 


/ i y 2 

y 27 t<j 2 J 


|U.) 2 /(2o- 2 ) 


por consiguiente 

ln[/(Xj, . . . , x n ; ¡x, o- 2 )] = - ~ ln(27rcr 2 ) - — 'Z(x l - fx ) 2 

2 2a ¿ 


Para determinar los valores maximizantes dep, y a 2 , se deben tomar las derivadas parciales 
de ln(/) con respecto a ¡x y <r 2 , igualarlas a cero y resolver las dos ecuaciones resultantes. 
Omitiendo los detalles, los estimadores de máxima probabilidad resultantes son 


jx = X 


l(X-X) 2 

n 


El estimador de máxima verosimilitud de cr 2 no es el estimador insesgado, por consiguien¬ 
te dos principios diferentes de estimación (insesgamiento y máxima verosimilitud) dan dos 
estimadores diferentes. ■ 


En el capítulo 3, se analizó el uso de la distribución de Poisson para modelar el número de 
“eventos” que ocurren en una región bidimensional. Suponga que cuando el área de la 
región R que se está muestreando es a(R), el número X de eventos que ocurren en R tiene 
una distribución de Poisson con parámetro Xa(R) (donde A es el número esperado de even¬ 
tos por unidad de área) y que las regiones no traslapantes dan X independientes. 

Suponga que un ecólogo selecciona n regiones no traslapantes R v ,. . . , R n y cuenta el 
número de plantas de una especie en cada región. La función masa de probabilidad conjun¬ 
ta es entonces 

[A • a(/?,)rie- A - a < s ri [A • a(R„)] x '¡e^ x ' a( - R n> 

P(x t , ■ . ■ , x n ; A) = .. Tj - 


)]- r i.[a(fl„)] A » • A Zr - • e - A ^¿> 


el ln(verosimilitud) es 

IntpC*!, . . . , x„; A)] = Yxí • ln[«(/é,)] + ln(A) • Xx, - A 'Za(R i ) - 2jn(x,!) 


Con d/dX \n(p) e igualándola a cero da 



- la(R.) = 0 


por consiguiente 


El estimador de máxima verosimilitud es entonces A = 2jX,7Xfl(^;)- Ésta es razonablemen¬ 
te intituitiva porque A es la densidad verdadera (plantas por unidad de área), mientras que A 
es la densidad muestral puesto que T<a{R¡) es tan sólo el área total muestreada. Como 
E(X¡) = A • a(R¡), el estimador es insesgado. 

En ocasiones se utiliza un procedimiento de muestreo alternativo. En lugar de fijar las 
regiones que van a ser muestreadas, el ecólogo seleccionará n puntos en toda la región de 
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Ejemplo 6.19 


PROPOSICIÓN 


interés y sea y¡ = la distancia del ;-ésimo punto a la planta más cercana. La función de dis¬ 
tribución acumulativa de Y = distancia a la planta más cercana es 


F Y (y) = P(Y< y) = 1 -P(Y>y)= 1 


’l 


= _ e-^ 2 (\TTy 2 ) 0 = _ 

0! 


/ ninguna planta en 
un círculo de radio y 


-A'7 T}’ ¿ 


Al tomar la derivada de F Y (y) con respecto a y proporciona 


fy(r, A) 


27r\ye Xlry ~ y > 0 
0 de lo contrario 


Si ahora se forma la probabilidad f Y (y{, A)./ r (y n ; A), derive ln(verosimilitud), y así 

sucesivamente, el estimador de máxima verosimilitud resultante es 

^ _ n _ número de plantas observadas 
tt^Y] área total muestreada 

la que también es una densidad muestral. Se puede demostrar que un ambiente ralo (peque¬ 
ño A), el método de distancia es en cierto sentido mejor, en tanto que en un ambiente den¬ 
so, el primer método de muestreo es mejor. ■ 


Sean Aj, . . ., X n una muestra aleatoria de una función de densidad de probabilidad Weibull 


/(*; a, j3) 


—— • x a 1 • e (x/ ^ a j>0 

/3“ 

0 de lo contrario 


Si se escribe la verosimilitud y el ln(verosimilitud) y luego con (d/da)[ln(/)] = 0 y 
(0/dj8)[ln(/)] = 0 se obtienen las ecuaciones 


X*“' ln (■*,-) _ X InC-y,) "! 1 

n _ 


p 



Va 


Estas dos ecuaciones no pueden ser resueltas explícitamente para obtener fórmulas generales 
de los estimadores de máxima verosimilitud á y ¡3. En su lugar, por cada muestra x¡, . .., x n , 
las ecuaciones deben ser resueltas con un procedimiento numérico iterativo. Incluso los esti¬ 
madores de momento de a y /3 son un tanto complicados (véase el ejercicio 21). ■ 


Estimación de funciones de parámetros 

En el ejemplo 6.17, se obtuvo el estimador de máxima verosimilitud de a 2 cuando la distri¬ 
bución subyacente es normal. El estimador de máxima verosimilitud de cr = \ícr 2 , como 
el de muchos otros estimadores de máxima verosimilitud, es fácil de derivar con la siguien¬ 
te proposición. 


El principio de invarianza 

Sean Ó,, Ó 2 , . . . , 0 m los estimadores de máxima verosimilitud de los parámetros 
0[, 6 2 , ■ ■ ■ , 0 m . Entonces el estimador de máxima verosimilitud de cualquier función 
h(6 j, 0 2 , ■ ■ ■ , 9,„ ) de estos parámetros es la función /í(0¡,0 2 , • • • ,9 m ) de los estimado¬ 
res de máxima verosimilitud. 
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Ejemplo 6.20 

(continuación 
del ejemplo 
6.17) 


En el caso normal, los estimadores de máxima verosimilitud de /r y cr 2 son ¡± = X y a 2 = 
Y.(X¡ — X) 2 /n. Para obtener el estimador de máxima verosimilitud de la función /z(/x, a 2 ) 
= Ver 2 = cr, sustituya los estimadores de máxima verosimilitud en la función. 


m = vd- 2 = -£(X,.-X ) 2 
n 


1/2 


el estimador de máxima verosimilitud de cr no es la desviación estándar muestral S y se 
aproximan bastante cuando n es bastante pequeño. ■ 


Ejemplo 6.21 

(continuación 
del ejemplo 
6.19) 


El valor medio de una variable aleatoria X que tiene una distribución Weibull es 

¡jl = j8 • T(1 + 1/a) 

El estimador de máxima verosimilitud de ¡jl es por consiguiente [jl = /3F(I 4- 1/á), donde a 
y ¡3 son los estimadores de máxima verosimilitud de a y ¡3. En particular X no es el esti¬ 
mador de máxima verosimilitud de ¡x, aunque es un estimador insesgado. Por lo menos con 
n grande, ¡1 es un mejor estimador que X ■ 


Comportamiento con muestra grande del estimador 
de máxima verosimilitud 

Aunque el principio de la estimación de máxima verosimilitud tiene un considerable atrac¬ 
tivo intuitivo, la siguiente proposición proporciona razones adicionales fundamentales para 
el uso de estimadores de máxima verosimilitud. 


PROPOSICIÓN 


En condiciones muy generales en relación con la distribución conjunta de la muestra, 
cuando el tamaño de la muestra n es grande, el estimador de máxima verosimilitud 
de cualquier parámetro 9 es aproximadamente insesgado \E{9) ~ 6] y su varianza es 
casi tan pequeña como la que puede ser lograda por cualquier estimador. Expresado 
de otra manera, el estimador de máxima verosimilitud 9 es aproximadamente el esti¬ 
mador insesgado con varianza mínima de 9. 


Debido a este resultado y al hecho de que las técnicas basadas en el cálculo casi siempre 
pueden ser utilizadas para derivar los estimadores de máxima verosimilitud (aunque a veces 
se requieren métodos numéricos, tales como el método de Newton), la estimación de máxima 
verosimilitud es la técnica de estimación más ampliamente utilizada entre los estadísticos. 
Muchos de los estimadores utilizados en lo que resta del libro son estimadores de máxima 
verosimilitud. La obtención de un estimador de máxima verosimilitud, sin embargo, requie¬ 
re que se especifique la distribución subyacente. 


Algunas complicaciones 

En ocasiones no se puede utilizar el cálculo para obtener estimadores de máxima verosimilitud. 


Ejemplo 6.22 


Suponga que mi tiempo de espera de un autobús está uniformemente distribuido en [0, 9] y 
que se observaron los resultados jt¡, . . . , x n de una muestra aleatoria tomada de esta distri¬ 
bución. Como/(x; 9) = 1/9 con 0 < x < 0, y 0 de lo contrario, 


/(*i, ■ ■ • , ■*„; 9) 



0 < x 1 < 9, . . . , 0 < x n < 9 
de lo contrario 


En tanto máx(x¡) < 9, la verosimilitud es 1/0", la cual es positiva, pero en cuanto 9 < 
máx(;r,), la verosimilitud se reduce a 0. Esto se ilustra en la figura 6.5. El cálculo no fun¬ 
ciona porque el máximo de la probabilidad ocurre en un punto de discontinuidad. 
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Figura 6.5 Función de probabilidad del ejemplo 6.22. 



pero la figura indica que 9 = máx(2Q. Por consiguiente si mis tiempos de espera son 2.3, 
3.7, 1.5, 0.4 y 3.2, entonces el estimador de máxima verosimilitud es 0 = 3.7. ■ 

Ejemplo 6.23 


La naturaleza de valor entero de N, dificultaría tomar la derivada de p(x; N). Sin embargo, 
si se considera la razón de p(x\ N) a p(x; N — 1), se tiene 

p(x; N ) = (N — M) • (N — n) 

p(x; N - 1) N(N - M-n+x) 

Esta razón es más grande que 1 si y sólo si N < Mn/x. El valor de N con el cual p(x: N) se 
incrementa al máximo es por consiguiente el entero más grande menor que Mn/x. Si se uti¬ 
liza la notación matemática estándar [r] para el entero más grande menor que o igual a r, el 
estimador de máxima probabilidad de N es N = [Mn/x]. Como ilustración, si M = 200 peces 
se sacan del lago y etiquetan, posteriormente n = 100 son recapturados y entre los 100 hay 
x = 11 etiquetados, en ese caso Ñ = [(200)(100)/11] = [1818.18] = 1818. La estimación 
es en realidad un tanto intuitiva; x/n es la proporción de la muestra recapturada etiquetada, 
mientras que M/N es la proporción de toda la población etiquetada. La estimación se obtiene 
igualando estas dos proporciones (estimando una proporción poblacional mediante una pro¬ 
porción muestral). ■ 

Supóngase que X v X 2 , . . . , X n es una muestra aleatoria de una función de densidad 
de probabilidad/(x; 9 ) simétrica con respecto a 0 aunque el investigador no está seguro de 
la forma de la función /. Es entonces deseable utilizar un estimador 9 robusto, es decir, 
uno que funcione bien con una amplia variedad de funciones de densidad de probabilidad 


Un método que a menudo se utiliza para estimar el tamaño de una población de vida sil¬ 
vestre implica realizar un experimento de captura/recaptura. En este experimento, se captu¬ 
ra una muestra inicial de M animales, y cada uno se éstos se etiqueta y luego son regresados 
a la población. Tras de permitir un tiempo suficiente para que los individuos etiquetados 
se mezclen con la población, se captura otra muestra de tamaño n. Con X = el número de 
animales etiquetados en la segunda muestra, el objetivo es utilizar las x observadas para esti¬ 
mar la población de tamaño N. 

El parámetro de interés es 9 = N, el cual asume sólo valores enteros, así que incluso 
después de determinar la función de verosimilitud (función masa de probabilidad de X en 
este caso), el uso del cálculo para obtener N presentaría dificultades. Si se considera un éxi¬ 
to la recaptura de un animal previamente etiquetado, entonces el muestreo es sin reemplazo 
de una población que contiene M éxitos y N — M fallas, de modo que X es una variable alea¬ 
toria hipergeométrica y la función de probabilidad es 


p(x\ N) = h(x; n, M,N) = 


N 

n 


M 

■ x 


O 
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subyacentes. Un estimador como ése es una media recortada. En años recientes, los esta¬ 
dísticos han propuesto otro tipo de estimador, llamado estimador M, basado en una genera¬ 
lización de la estimación de máxima verosimilitud. En lugar de incrementar al máximo el 
logaritmo de la probabilidad £ln[/(x; 0)] para una / específica, se incrementa al máximo 
2p(x,; 0). Se selecciona la “función objetivo” p para que dé un estimador con buenas pro¬ 
piedades de robustez. El libro de David Hoaglin y colaboradores (véase la bibliografía) con¬ 
tiene una buena exposición de esta materia. 


EJERCICIOS Sección 6.2 (20-30) 


20. Se selecciona una muestra aleatoria de n cascos para ciclis¬ 
tas fabricados por una compañía. Sea X = el número entre 
los n que están agrietados y sea p — P(agrietado). Suponga 
que sólo se observa X, en lugar de la secuencia de S y F. 

a. Obtenga el estimador de máxima verosimilitud de p. Si 
n = 20 y x — 3, ¿cuál es la estimación? 

b. ¿Es insesgado el estimador del inciso a)? 

c. Si n = 20 y x = 3, ¿cuál es el estimador de máxima 
verosimilitud de la probabilidad (1 — p) s de que ningu¬ 
no de los siguientes cinco cascos esté agrietado? 

21. Si X tiene una distribución de Weibull con parámetros a y 
fi, entonces 

E(X) = ¡i • T(1 + 1/a) 

v(x) = ¿8 2 {ro + 2/a) - [ra + i moh 

a. Basado en una muestra aleatoria Aj, . . . , Aj, escriba 
ecuaciones para el método de estimadores de momentos 
fi y a. Demuestre que, una vez que se obtiene la estima¬ 
ción de a, la estimación de fi se puede hallar en una 
tabla de la función gama y que la estimación de a es la 
solución de una ecuación complicada que implica la fun¬ 
ción gama. 

b. Si 77 = 20, x = 28.0 y = 16 500, calcule las esti¬ 
maciones. [ Sugerencia: |T(1.2)] 2 /r(1.4) = 0.95.] 

22. Sea X la proporción de tiempo destinado que un estudiante 
seleccionado al azar pasa resolviendo cierta prueba de apti¬ 
tud. Suponga que la función de densidad de probabilidad de 
X es 


/(*; 0 ) 


1(0 + l)x e 

1 o 


0 1 
de lo contrario 


donde — 1 < 0. Una muestra aleatoria de diez estudiantes 
produce los datos x¡ = 0.92, x 2 = 0.79, x 3 = 0.90, x A = 0.65, 
x 5 = 0.86, x 6 = 0.47, x 7 = 0.73, x s = 0.97, x 9 = 0.94, 
x 10 = 0.77. 

a. Use el método de momentos para obtener un estimador 
de 0 y luego calcule la estimación con estos datos. 

b. Obtenga el estimador de máxima verosimilitud de 0 y 
luego calcule la estimación con los datos dados. 

23. Dos sistemas de computadoras diferentes son monitoreados 
durante un total de n semanas. Sea X¡ el número de descom¬ 
posturas del primer sistema durante la ¿-ésima semana y 
suponga que las X¡ son independientes y que se extraen de 
una distribución de Poisson con parámetro A¡. Asimismo, 
sea Y¡ el número de descomposturas del segundo sistema du¬ 
rante la semana /-ésima y suponga independencia con cada 
Y¡ extraída de una distribución de Poisson con parámetro A 2 . 


Derive los estimadores de máxima verosimilitud de Aj, A 2 y 
A¡ — A 2 . [Sugerencia: Utilizando independencia, escriba la 
función masa de probabilidad conjunta de las X¡ y FJuntas.] 

24. Remítase al ejercicio 20. En lugar de seleccionar n = 20 
cascos para examinarlos, suponga que se examinan en suce¬ 
sión hasta que se encuentran r = 3 agrietados. Si el vigési¬ 
mo percentil casco es el tercer agrietado (de modo que el 
número de cascos examinados que no están agrietados sea 
x = 17), ¿cuál es el estimador de máxima verosimilitud de 
p? ¿Es ésta la misma estimación del ejercicio 20? ¿Por qué 
sí o por qué no? ¿Es la misma que la estimación calculada 
con el estimador insesgado del ejercicio 17? 

25. Se determina la resistencia al esfuerzo cortante de soldadu¬ 
ras de puntos de prueba y se obtienen los siguientes datos 
(lb/pulg 2 ): 

392 376 401 367 389 362 409 415 358 375 

a. Suponiendo que la resistencia al esfuerzo cortante está 
normalmente distribuida, estime la resistencia al esfuer¬ 
zo cortante promedio verdadera y la desviación estándar 
de la resistencia al esfuerzo cortante utilizando el méto¬ 
do de máxima verosimilitud. 

b. De nuevo suponiendo una distribución normal, calcule 
el valor de resistencia por debajo del cual 95% de todas 
las soldaduras tendrán sus resistencias. [Sugerencia: 
¿Cuál es el percentil 95 en función de p y <x? Utilice 
ahora el principio de invarianza.] 

26. Remítase al ejercicio 25. Suponga que decide examinar otra 
soldadura de puntos de prueba. Sea X — resistencia al esfuer¬ 
zo cortante de la soldadura. Use los datos dados para obtener 
el estimador de máxima verosimilitud de P{X £ 400). 
[Sugerencia: P(X < 400) = <f>((400 - p ,)/cr).] 

27. Sean Aj, . . . , X n una muestra aleatoria de una distribución 
gama con parámetros a y fi. 

a. Derive las ecuaciones cuya solución da los estimadores 
de máxima verosimilitud de a y fi. ¿Piensa que pueden 
ser resueltos explícitamente? 

b. Demuestre que el estimador de máxima verosimilitud de 
p = afi es (L = X. 

28. Si Aj, A/,, . . . ,X n representan una muestra aleatoria de la 
distribución Rayleigh con función densidad dada en el ejer¬ 
cicio 15. Determine: 

a. El estimador de máxima verosimilitud de 0 y luego cal¬ 
cule la estimación con los datos de esfuerzo de vibración 
dados en ese ejercicio. ¿Es este estimador el mismo que 
el estimador insesgado del ejercicio 15? 
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252 CAPITULO 6 Estimación puntual 

b. El estimador de máxima verosimilitud de la mediana de 
la distribución del esfuerzo de vibración. [ Sugerencia: 
Exprese primero la mediana en función de 0.] 

29. Considere la muestra aleatoria X v X 2 , . . . , X n de la función 
de densidad de probabilidad exponencial desplazada 

ñx-\ m = í Ae-A< * -9) x ~ e 
J ' ’ ’ ' [ 0 de lo contrario 

Con 9 = 0 da la función de densidad de probabilidad de la dis¬ 
tribución exponencial previamente considerada (con densidad 
positiva a la derecha de cero). Un ejemplo de la distribución 
exponencial desplazada apareció en el ejemplo 4.5, en el 
cual la variable de interés fue el tiempo entre vehículos en 
el flujo de tráfico y 9 = 0.5 fue el tiempo entre vehículos 
máximo posible. 

a. Obtenga los estimadores de máxima verosimilitud de 9 y A. 


b. Si n = 10 observaciones de tiempo entre vehículos son 
realizadas y se obtienen los siguientes resultados 3.11, 
0.64, 2.55, 2.20, 5.44, 3.42, 10.39, 8.93, 17.82 y 1.30, 
calcule las estimaciones de 9 y A. 

30. En los instantes f = 0, 20 componentes idénticos son puestos 
a prueba. La distribución de vida útil de cada uno es expo¬ 
nencial con parámetro A. El experimentador deja la instala¬ 
ción de prueba sin monitorear. A su regreso 24 horas más 
tarde, el experimentador termina de inmediato la prueba des¬ 
pués de notar que y = 15 de los 20 componentes aún están en 
operación (así que 5 han fallado). Derive el estimador de 
máxima verosimilitud de A. [Sugerencia'. Sea Y — el número 
que sobreviven 24 horas. En ese caso Y ~ Bin(n, p). ¿Cuál es 
el estimador de máxima verosimilitud de p? Observe ahora 
que p = P(X¡ a 24), donde X¡ está exponencialmente distri¬ 
buida. Esto relaciona A con p, de modo que el primero puede 
ser estimado una vez que lo ha sido el segundo.] 


EJERCICIOS SUPLEMENTARIOS (31-38) 


31. Se dice que un estimador 9 es consistente si con cualquier 
e > 0, P( |0 — 9 | £: e) -» 0 a medida que n —» °°. Es decir, 
9 es consistente, si, a medida que el tamaño de muestra se 
hace más grande, es menos y menos probable que 9 se ale¬ 
je más que e del valor verdadero de 9. Demuestre que X es 
un estimador consistente de p cuando cr 2 < °° mediante la 
desigualdad de Chebyshev del ejercicio 44 del capítulo 3. 
[,Sugerencia : La desigualdad puede ser reescrita en la forma 

P(\Y- p Y \>e)^a 2 /e 
Ahora identifique Y con A.] 

32. a. Sean A¡, . . . , A n una muestra aleatoria de una distribu¬ 

ción uniforme en [0, 9], Entonces el estimador de máxi¬ 
ma verosimilitud de 9 es 9 = Y = máx(A,). Use el 
hecho de que Y £ y si y sólo si cada X¡ £ y para obtener 
la función de distribución acumulativa de Y. Luego 
demuestre que la función de densidad de probabilidad 
de Y = máxjlQ es 


0 de lo contrario 

b. Use el resultado del inciso a) para demostrar que el esti¬ 
mador de máxima verosimilitud es sesgado pero que 
(n + l)máxUQ/n es insesgado. 

33. En el instante t = 0, hay un individuo vivo en una población. 

Un proceso de nacimientos puro se desarrolla entonces 
como sigue. El tiempo hasta que ocurre el primer nacimien¬ 
to está exponencialmente distribuido con parámetro A. 
Después del primer nacimiento, hay dos individuos vivos. El 
tiempo hasta que el primero da a luz otra vez es exponencial 
con parámetro A y del mismo modo para el segundo indivi¬ 
duo. Por consiguiente, el tiempo hasta el siguiente naci¬ 
miento es el mínimo de dos variables (A) exponenciales, el 
cual es exponencial con parámetro 2A. Asimismo, una vez 36. 
que el segundo nacimiento ha ocurrido, hay tres individuos 


vivos, de modo que el tiempo hasta el siguiente nacimiento 
es una variable aleatoria exponencial con parámetro 3A y así 
sucesivamente (aquí se está utilizando la propiedad de 
amnesia de la distribución exponencial). Suponga que se 
observa el proceso hasta que el sexto nacimiento ha ocurri¬ 
do y los tiempos hasta los nacimientos sucesivos son 25.2, 
41.7, 51.2, 55.5, 59.5, 61.8 (con los cuales deberá calcular 
los tiempos entre nacimientos sucesivos). Obtenga el esti¬ 
mador de máxima verosimilitud de A. [Sugerencia'. La vero¬ 
similitud es un producto de términos exponenciales.] 

34. El error cuadrático medio de un estimador 9 es ECM((9) = 
E(9 — 9) 1 . Si 9 es insesgado, entonces ECM(0) = V(9), pero 
en general ECM(Ó) = V(9) + (sesgo) 2 . Considere el estima¬ 
dor <j 2 = KS 2 , donde S 2 = varianza muestral. ¿Qué valor 
de K reduce al mínimo el error cuadrático medio de este 
estimador cuando la distribución de la población es normal? 
[Sugerencia: Se puede demostrar que 

£[(S 2 ) 2 ] = {n + 1 )<x 4 /(n - 1) 

En general, es difícil determinar 9 para reducir al mínimo 
el ECM(0), por lo cual se buscan sólo estimadores insesga¬ 
dos y reducir al mínimo V(<9).] 

35. Sean A¡, . ... X n una muestra aleatoria de una función de 
densidad de probabilidad simétrica con respecto a p. Un 
estimador de p que se ha visto que funciona bien con una 
amplia variedad de distribuciones subyacentes es el estima¬ 
dor de Hodges-Lehmann. Para definirla, primero calcule 
para cada i£j y cada y = 1 , 2, ..., n el promedio por pares 
X¡j = (A, + Xj)/2. Entonces el estimador es p = la media¬ 
na de las X¡j. Calcule el valor de esta estimación con los 
datos del ejercicio 44 del capítulo 1. [Sugerencia: 
Construya una tabla con las x¡ en el margen izquierdo y en 
la parte superior. Luego calcule los promedios en y sobre la 
diagonal.] 

Cuando la distribución de la población es normal, se puede 
utilizar la mediana estadística { | A¡ — A |,.. ., | X n — X | } 
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/0.6745 para estimar a. Este estimador es más resistente a los 
efectos de los valores apartados (observaciones alejadas del 
grueso de los datos) que es la desviación estándar muestral. 
Calcule tanto la estimación puntual correspondiente como 5 
de los datos del ejemplo 6.2. 

37. Cuando la desviación estándar muestral S está basada en 
una muestra aleatoria de una distribución de población nor¬ 
mal, se puede demostrar que 

E(S) = V2 I(n - l)Y(nl2)(rlT{(n - l)/2) 

Use ésta para obtener un estimador insesgado de cr de la 
forma cS. ¿Cuál es c cuando n = 20? 


Bibliografía 253 

38. Cada uno de n especímenes tiene que ser pesado dos veces en 
la misma báscula. Sean X¡ y Y¡ los dos pesos observados del 
i-ésimo espécimen. Suponga que X¡ y Y¡ son independientes 
uno de otro, cada uno normalmente distribuido con valor me¬ 
dio p¡ (el peso verdadero del espécimen i) y varianza cr 2 . 

a. Demuestre que el estimador de máxima verosimilitud de 

cr 2 es cr 2 = 2(Y¡ — Y¡) 2 /(4n). [Sugerencia: Si z — + 

z 2 )/2, entonces 2(z¡ - z) 2 = (z, - z 2 ) 2 /2.] 

b. ¿Es el estimador de máxima verosimilitud <x 2 un estima¬ 
dor insesgado de cr 2 ? Determine una estimador insesga¬ 
do de a 2 . [Sugerencia : Con cualquier variable aleatoria 
Z, E(Z 2 ) = V(Z) + \E(Z)\ 2 . Aplique ésta a Z = X¡ - Y¡.] 
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INTRODUCCIÓN 


Una estimación puntual, por el hecho de ser un solo número no proporciona infor¬ 
mación sobre la precisión y confiabilidad de la estimación. Considérese, por ejemplo, 
utilizar el estadístico X para calcular una estimación puntual de la resistencia a la rup¬ 
tura promedio verdadera (g) de toallas de papel de cierta marca y supóngase que 
x = 9322.7. Debido a la variabilidad del muestreo, virtualmente nunca es el caso de 
que x = i±. La estimación puntual no dice nada sobre qué tan cerca pudiera estar a 
/i. Una alternativa para reportar un solo valor sensible del parámetro que se está es¬ 
timando es calcular y reportar un intervalo completo de valores factibles: una estima¬ 
ción de intervalo o un intervalo de confianza (IC). Un intervalo de confianza siempre 
se calcula seleccionando primero un nivel de confianza, el cual mide el grado de con¬ 
fiabilidad del intervalo. Un intervalo de confianza con 95% de nivel de confianza 
de la resistencia a la ruptura promedio verdadera podría tener un límite inferior de 
9162.5 y un límite superior de 9482.9. Entonces al nivel de confianza de 95%, cual¬ 
quier valor de /i entre 9162.5 y 9482.5 es factible. Un nivel de confianza de 95% im¬ 
plica que 95% de todas las muestras daría un intervalo que incluye /i, o cualquier 
otro parámetro que se esté estimando y sólo 5% de las muestras darían un interva¬ 
lo erróneo. Los niveles de confianza más frecuentemente utilizados son 95%, 99% 
y 90%. Mientras más alto es el nivel de confianza, más fuerte es la creencia de que 
el valor del parámetro que se está estimando queda dentro del intervalo (en breve se 
dará una interpretación de cualquier nivel de confianza particular). 

El ancho del intervalo da información sobre la precisión de una estimación de 
intervalo. Si el nivel de confianza es alto y el intervalo resultante es bastante angos¬ 
to, el conocimiento del valor del parámetro es razonablemente preciso. Un muy am¬ 
plio intervalo de confianza, sin embargo, transmite el mensaje de que existe gran 
cantidad de incertidumbre sobre el valor de lo que se está estimando. La figura 7.1 
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7.1 Propiedades básicas de los intervalos de confianza 


255 


muestra intervalos de confianza de 95% de resistencias a la ruptura promedio verda¬ 
deras de dos marcas diferentes de marcas de toallas de papel. Uno de estos intervalos 
sugiere un conocimiento preciso de fi, mientras que el otro sugiere un rango muy am¬ 
plio de valores factibles. 


Marca 1: 
Marca 2: 


<—y 


-f 


Resistencia 

Resistencia 


ura Intervalos de confianza que indican información precisa (marca 1) e imprecisa (marca 2) 
sobre ¡x. 


7.1 Propiedades básicas de los intervalos de confianza 


Los conceptos y propiedades básicas de los intervalos de confianza son más fáciles de in¬ 
troducir si primero se presta atención a un problema simple, aunque un tanto irreal. Supón¬ 
gase que el parámetro de interés es una media poblacional ¡j, y que: 

1. La distribución de la población es normal. 

2. El valor de la desviación estándar cr de la población es conocido. 

Con frecuencia la normalidad de la distribución de la población es una suposición razona¬ 
ble. Sin embargo, si el valor de /i es desconocido, no es factible que el valor de cr estaría 
disponible (el conocimiento del centro de una población en general precede a la informa¬ 
ción con respecto a la dispersión). En secciones posteriores, se desarrollarán métodos basa¬ 
dos en suposiciones menos restrictivas. 

Ejemplo 7.1 Ingenieros industriales especialistas en ergonomía se ocupan del diseño de espacios de tra¬ 
bajo y dispositivos operados por trabajadores con objeto de alcanzar una alta productividad 
y comodidad. El artículo “Studies on Ergonomically Designed Alphanumeric Keyboards” 
(Human Factors, 1985: 175-187) reporta sobre un estudio de altura preferida de un teclado 
experimental con un gran soporte para el antebrazo y muñeca. Se seleccionó una muestra de 
n = 31 mecanógrafos entrenados y se determinó la altura preferida del teclado de cada me¬ 
canógrafo. La altura preferida promedio muestral resultante fue de 3c = 80.0 cm. Suponien¬ 
do que la altura preferida está normalmente distribuida con cr = 2.0 cm (un valor sugerido 
por datos que aparecen en el artículo), obtenga un intervalo de confianza para /r, la altura pre¬ 
ferida promedio verdadera por la población de todos los mecanógrafos experimentados. ■ 

Se supone que las observaciones muéstrales reales x¡, x 2 , , x n son el resultado de 

una muestra aleatoria X v . ... X n tomada de una distribución normal con valor medio ¡jl y 
desviación estándar cr. Los resultados del capítulo 5 implican entonces que independiente¬ 
mente del tamaño de muestra n, la media muestral X está normalmente distribuida con va¬ 
lor esperado ¡i y desviación estándar cr/Vñ. Si se estandariza X restando primero su valor 
esperado y luego dividiendo entre su desviación estándar se obtiene la variable normal es¬ 
tándar 


X-¡i 
cr/x'Ti 


(7.1) 
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256 CAPÍTULO 7 Intervalos estadísticos basados en una sola muestra 

Como el área bajo la curva normal estándar entre —1.96 y 1.96 es 0.95, 

—1.96 < < 1.96 j = 0.95 (7.2) 

A continuación manipúlense las desigualdades que están adentro del paréntesis en 
(7.2) de modo que aparezcan en la forma equivalente l < p < u, donde los puntos extremos 
I y u implican a X y cr/Vñ. Esto se logra mediante la siguiente secuencia de operaciones y 
cada una da desigualdades equivalentes a las originales. 

1 . Multipliqúese por cr/Vñ: 


— 1.96 • 77 = < X — ix < 1.96 • —/= 

Vn Vh 


2. Réstese X de cada término: 


-X - 1.96 • 7 “ 7 = < — ¡x < —X + 1.96 • - 7 = 

Vn Vn 

3. Multipliqúese por — 1 para eliminar el signo menos en frente de /x (el cual invierte la di¬ 
rección de cada desigualdad): 



X + 1.96 • V= > ix > X - 1.96 • ~rr 
Vn Vn 

es decir, 

X - 1.96 • < p, < X + 1.96 • T °r 

V n V n 

La equivalencia de cada conjunto de desigualdades con el conjunto original implica que 

P (^ ■ L96 ^k < ^ < x+ L 96 ^k) = °- 95 ( 7 - 3 ) 

El evento en el interior del paréntesis en (7.3) tiene una apariencia poco común; previamen¬ 
te, la cantidad aleatoria aparecía a la mitad con constantes en ambos extremos, como en 
a < Y < b. En (7.3) la cantidad aleatoria aparece en dos extremos, mientras que la constan¬ 
te desconocida ¡x aparece a la mitad. Para interpretar (7.3), considérese un intervalo aleatorio 
con el punto extremo izquierdo X — 1.96 • cr/Vñ y punto extremo derecho X + 1.96 • cr/Vñ. 
En notación de intervalo, esto se transforma en 

(x- 1.96-^.X + 1.96-4) (7.4) 

El intervalo (7.4) es aleatorio porque los dos puntos extremos del intervalo implican una va¬ 
riable aleatoria. Está centrada en la media muestral X y se extiende a 1.96cr/Vñ a cada 
lado de X. Por consiguiente el ancho del intervalo es 2 • (1.96) • cr/Vñ, el cual no es alea¬ 
torio; sólo su localización (su punto medio X) lo es (figura 7.2). Ahora (7.3) puede ser pa¬ 
rafraseado como “la probabilidad es 0.95 de que el intervalo aleatorio (7.4) incluya o cubra 
el valor verdadero de /x". Antes de realizar cualquier experimento y de recolectar cualquier 
dato, es bastante probable que /x estará adentro del intervalo (7.4). 


1.96 crls/li 1.96 cr/y/W 



X — 1.96 cr/s/rT X X + 1.96 artsfñ 


Figura 7.2 Intervalo aleatorio (7.4) con su centro en X. 
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DEFINICIÓN 


Ejemplo 7.2 

(continuación 
del ejemplo 
7.1) 


Si después de observar X 1 = x 1? X 2 = x 2 . X n = x„, se calcula la media muestral 

observada x y luego se sustituye x en (7.4) en lugar de X , el intervalo fijo resultante 
se llama intervalo de 95 % de confianza para ¡jl. Este intervalo de confianza se ex¬ 
presa como 

/_ cr _ a \ 

I x — 1.96 • x l- 9 ^ ‘ I es un intervalo de 95% de confianza para /u, 
o cuando 

_ cr _ cr 

x — 1.96 • — 7 = < u < x + 1.96 • —¡= con 95% de confianza 
Vn Vn 

Una expresión concisa para el intervalo es x ± 1.96 • cr/Vn, donde - da el punto ex¬ 
tremo izquierdo (límite inferior) y + da el punto extremo derecho (límite superior). 


Las cantidades requeridas para calcular el intervalo de 95% de confianza para la altura pre¬ 
ferida promedio verdadera son cr = 2.0, n = 31 y x = 80.0. El intervalo resultante es 

o- 2.0 

x ± 1.96 • ^ = 80.0 ± ü- 96 ):^ = 80 -° ± °- 7 = (79J ’ 8a7) 

Es decir, se puede estar totalmente confiado, en el nivel de confianza de 95%, de que 
79.3 < ¡jl < 80.7. Este intervalo es relativamente angosto, lo que indica que q, ha sido esti¬ 
mada con bastante precisión. ■ 

Interpretación de un intervalo de confianza 

El nivel de 95% de confianza para el intervalo que se acaba de definir fue heredado de 0.95 
de probabilidad para el intervalo aleatorio (7.4). Los intervalos con otros niveles de confian¬ 
za serán introducidos en breve. Por ahora, más bien, considérese cómo se puede interpretar 
el 95% de confianza. 

Como se inició con un evento cuya probabilidad era de 0.95, de que el intervalo alea¬ 
torio (7.4) capturaría el valor verdadero de ¡jl, y luego se utilizaron los datos del ejemplo 7.1 
para calcular el intervalo de confianza (79.3, 80.7), es tentador concluir que ¡x está dentro 
de este intervalo fijo con probabilidad de 0.95. Pero al sustituir x = 80.0 en lugar de X, to¬ 
da la aleatoriedad desaparece; el intervalo (79.3, 80.7) no es un intervalo aleatorio y ¡x es 
una constante (desafortunadamente desconocida). Es por consiguiente incorrecto escribir la 
proposición P(/x queda en (79.3, 80.7)) = 0.95. 

Una interpretación correcta de “95% de confianza” se basa en la interpretación de pro¬ 
babilidad de frecuencia relativa a largo plazo. Decir que un evento A tiene una probabilidad 
de 0.95 es decir que si el experimento en el cual se definió A se realiza una y otra vez, a la 
larga A ocurrirá el 95% del tiempo. Supóngase que se obtiene otra muestra de alturas pre¬ 
feridas por los mecanógrafos y se calcula otro intervalo de 95%. Luego se considera repetir 
esto con una tercera muestra, una cuarta, una quinta, y así sucesivamente. Sea A el evento 
en que X — 1.96 • cr/Vn < fx < X + 1.96 • cr/Vn. Ya que P(A) = 0.95, a la larga el 95% 
de los intervalos de confianza calculados contendrán ¡jl. Esto se ilustra en la figura 7.3, 
donde la línea vertical corta el eje de medición en el valor verdadero (pero desconocido) de 
ju,. Obsérvese que de los 11 intervalos ilustrados, sólo los intervalos 3 y 11 no contienen ¡jl. 
A la larga, sólo 5% de los intervalos construidos así no contendrán ¡jl. 

De acuerdo con esta interpretación, el nivel de confianza de 95% no es en sí una pro¬ 
posición sobre cualquier intervalo particular tal como (79.3, 80.7). En su lugar pertenece a 
lo que sucedería si se construyera un número de intervalos como esos por medio de la misma 
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CAPÍTULO 7 Intervalos estadísticos basados en una sola muestra 


.,. , Valor verdadero de u 

Numero de ^ 

intervalo | 

(1) -«=1-»- 

(2) -H s - 

(3) -h— 

(4) — 

(5) - 


(6) -e 

(7) 

( 8 ) 

(9) 


(10) —c— 

( 11 ) «-*- 

Figura 7.3 Construcción repetida de intervalos de confianza de 95 por ciento. 

fórmula de intervalo de confianza. Aunque esto puede parecer no satisfactorio, el origen de la 
dificultad yace en la interpretación de probabilidad, es válida para una larga secuencia de 
réplicas de un experimento en lugar de sólo para una. Existe el método de abordar la cons¬ 
trucción e interpretación de intervalos de confianza que utiliza la noción de probabilidad 
subjetiva y el teorema de probabilidad de Bayes, aunque los detalles técnicos se salen del 
alcance de este libro; el libro de DeGroot y colaboradores (véase la bibliografía del capítulo 6) 
es una buena fuente. El intervalo presentado aquí (así como también cada intervalo presenta¬ 
do subsecuentemente) se llama intervalo de confianza “clásico” porque su interpretación se 
apoya en la noción clásica de probabilidad (aunque las ideas principales se desarrollaron tan 
recientemente como en la década de 1930). 




Otros niveles de confianza 

El nivel de confianza de 95% fue heredado de la probabilidad de 0.95 de las desigualdades 
iniciales que aparecen en (7.2). Si se desea un nivel de confianza de 99%, la probabili¬ 
dad inicial de 0.95 debe ser reemplazada por 0.99, lo que implica cambiar el valor crítico z 
de 1.96 a 2.58. Un intervalo de confianza de 99% resulta entonces de utilizar 2.58 en lugar de 
1.96 en la fórmula para el intervalo de confianza de 95 por ciento. 

Esto sugiere que cualquier nivel de confianza deseado se obtiene reemplazando 1.96 
o 2.58 con el valor crítico normal estándar apropiado. Como la figura 7.4 muestra, utilizan¬ 
do z al2 en lugar de 1.96 se logra una probabilidad de 1 — a. 


O 


Curva z 



Figura 7.4 P{-z al2 < Z < z al2 ) = 1 - a. 


DEFINICION 


La siguiente expresión da un intervalo de confianza de 100 (1 — a)% para la me¬ 
dia ¡jl de una población normal cuando se conoce el valor de a 


[x-z M -^x + Zal2 -^ 

o, de forma equivalente, por x ± Z a ,2 • (T/Vñ. 


(7.5) 
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No hace mucho tiempo que el proceso de producción de una caja de control de un tipo par¬ 
ticular para un motor fue modificado. Antes de esta modificación, datos históricos sugirieron 
que la distribución de diámetros de agujeros para bujes en las cajas era normal con desvia¬ 
ción estándar de 0.100 mm. Se cree que la modificación no ha afectado la forma de la distri¬ 
bución ni la desviación estándar, pero que el valor del diámetro medio pudo haber cambiado. 
Se selecciona una muestra de 40 cajas y se determina el diámetro de agujero para cada una 
y el resultado es un diámetro medio muestral de 5.426 mm. Calcúlese un intervalo de con¬ 
fianza para el diámetro de agujero promedio verdadero utilizando un nivel de confianza de 
90%. Esto requiere que 100(1 — a) = 90, de donde a = 0.10 y z n/2 = z 0 os = 1-645 (corres¬ 
pondiente a un área de curva z acumulativa de 0.9500). El intervalo deseado es entonces 

.100 

5.426 ± (1.645)^=j = 5.426 ± 0.026 = (5.400, 5.452) 

Con un razonablemente alto grado de confianza, se puede decir que 5.400 < /a < 5.452. Es¬ 
te intervalo es algo angosto debido a la pequeña cantidad de variabilidad del diámetro del 
agujero (cr = 0.100). ■ 


Nivel de confianza, precisión y tamaño de muestra 

¿Por qué decidirse por un nivel de confianza de 95% cuando un nivel de 99% es alcanza- 
ble? Porque el precio pagado por el nivel de confianza más alto es un intervalo más ancho. 
Como el intervalo de 95% se extiende 1.96 • cr/Vn a cada lado de x, el ancho del intervalo 
es 2(1.96) • crA/ñ = 3.92 • cr/Vn. Asimismo, el ancho del intervalo de 99% es 2(2.58) • 
cr/Vn = 5.16 • cr/Vn. Es decir, se tiene más confianza en el intervalo de 99% precisamente 
porque es más ancho. Mientras más alto es el grado de confianza, más ancho es el interva¬ 
lo resultante. En realidad, el único intervalo de 100% para /a es (—°°, °°), e l cual no es te¬ 
rriblemente informativo porque se sabía que este intervalo cubriría /a incluso antes del 
muestreo. 

Si se considera que el ancho del intervalo especifica su precisión o exactitud, enton¬ 
ces el nivel de confianza (o confiabilidad) del intervalo está relacionado de manera inversa 
con su precisión. La estimación de un intervalo altamente confiable puede ser imprecisa por 
el hecho de que los puntos extremos del intervalo pueden estar muy alejados, mientras que 
un intervalo preciso puede acarrear una confiabilidad relativamente baja. Por consiguiente 
no se puede decir de modo inequívoco que se tiene que preferir un intervalo de 99% a uno 
de 95%; la ganancia de confiabilidad acarrea una pérdida de precisión. 

Una estrategia atractiva es especificar tanto del nivel de confianza deseado como el 
ancho del intervalo y luego determinar el tamaño de muestra necesario. 


Un intensivo monitoreo de un sistema de tiempo compartido de computadoras sugiere que 
el tiempo de respuesta a un comando de edición particular está normalmente distribuido con 
desviación estándar de 25 milisegundos. Se instaló un nuevo sistema operativo y se desea 
estimar el tiempo de respuesta promedio verdadero /a en el nuevo entorno. Suponiendo que 
los tiempos de respuesta siguen estando normalmente distribuidos con cr = 25, ¿qué tama¬ 
ño de muestra es necesario para asegurarse de que el intervalo de confianza de 95% resul¬ 
tante tiene un ancho de (cuando mucho) 10? El tamaño de muestra n debe satisfacer 

10 = 2 • (1.96)(25/Vñ) 

Reordenando esta ecuación se obtiene 

Vñ = 2 • (1.96)(25)/10 = 9.80 


por consiguiente 


n = (9.80) 2 = 96.04 


En vista de que n debe ser un entero, se requiere un tamaño de muestra de 97. ■ 
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260 CAPÍTULO 7 Intervalos estadísticos basados en una sola muestra 

La fórmula general para el tamaño de muestra n necesario para garantizar un ancho 
de intervalo w se obtiene a partir de vv = 2 • z a/1 ■ cr/Vñ como 


n 


(T \2 





Mientras más pequeño es el ancho deseado w, más grande debe ser n. Además, n es una fun¬ 
ción creciente de cr (más variabilidad de la población requiere un tamaño de muestra más 
grande) y del nivel de confianza 100(1 — a) (conforme a decrece, z a¡2 se incrementa). 

La mitad del ancho 1.96<r/Vñ del intervalo de confianza de 95% en ocasiones se llama 
límite en el error de estimación asociado con un nivel de confianza de 95%. Es decir, con 
95% de confianza, la estimación puntual x no estará a más de esta distancia de /i. 
Antes de obtener datos, es posible que un investigador desee determinar un tamaño de muestra 
con el cual se logra un valor particular del límite. Por ejemplo, si /jl representa la eficiencia 
de combustible promedio (mpg) de todos los carros de cierto tipo, el objetivo de una inves¬ 
tigación puede ser estimar ¡x adentro de 1 mpg con 95% de confianza. Más generalmente, si 
se desea estimar ¡x adentro de una cantidad B (el límite especificado en el error de estima¬ 
ción) con confianza de 100(1 — a)%, el tamaño de muestra necesario se obtiene al reem¬ 
plazar 2/w por 1 IB en la fórmula adentro del cuadro precedente. 

Derivación de un intervalo de confianza 

Sean X v X 2 , . . . , X n la muestra en la cual se tiene que basar el intervalo de confianza para 
un parámetro 9. Supóngase que se puede determinar una variable aleatoria que satisface las 
dos siguientes propiedades: 

1. La variable depende funcionalmente tanto de X x , . . . , X n como de 9. 

2. La distribución de probabilidad de la variable no depende de 6 ni de cualesquiera otros 
parámetros desconocidos. 

Sea h(X x , X 2 , . . . , X n ; 6) esta variable aleatoria. Por ejemplo, si la distribución de 
la población es normal con cr conocida y 9 = ¡x la variable h(X x , . . . , X n ; ¡x) = 
(X — ^x)/(cr/^ñ) satisface ambas propiedades; claramente depende funcionalmente de ¡x, no 
obstante su distribución de probabilidad es normal estándar, la cual no depende de ¡x. En ge¬ 
neral, la forma de la función h casi siempre se pone de manifiesto al examinar la distribu¬ 
ción de un estimador apropiado 9. 

Con cualquier a entre 0 y 1, se ve que las constantes ay b satisfacen 

P(a < h(X x , . . . , X n \ 9) < b) = 1 - a (7.6) 

A causa de la segunda propiedad, a y b no dependen de 9. En el ejemplo normal, a = — z n ¡ 2 
y b = z a / 2 - Ahora supóngase que las desigualdades en (7.6) pueden ser manipuladas para ais¬ 
lar 9 y así se obtiene la proposición de probabilidad equivalente 

P(l(X v X 2 , ...,X n ) <9 < u(X v X 2 ,..., XJ) = 1 - a 

Entonces l(x x , x 2 , , x n ) y u(x v . . . , x n ) son los límites de confianza inferior y superior, 

respectivamente, para un intervalo de confianza de 100(1 — a)%. En el ejemplo normal, se 
vio que l(X j,. . ., X n ) = X — z a/2 ■ cr/Vñ y u(X j, . . . , X n ) = X + z an ■ cr/Vñ. 

Ejemplo 7.5 Un modelo teórico sugiere que el tiempo hasta la ruptura de un fluido aislante entre electro¬ 
dos a un voltaje particular tiene una distribución exponencial con parámetro A (véase la sec¬ 
ción 4.4). Una muestra aleatoria de n = 10 tiempos de ruptura da los siguientes datos 
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7.1 Propiedades básicas de los intervalos de confianza 261 

muéstrales (en min): x, = 41.53, x 2 = 18.73, x 3 = 2.99, x 4 = 30.34, x 5 = 12.33, x 6 = 117.52, 
x 7 = 73.02, x 8 = 223.63, x 9 = 4.00, x 10 = 26.78. Se desea un intervalo de 95% para A y para 
el tiempo de ruptura promedio verdadero. 

Sea h(X x , X 2 , . . . , X n ; A) = 2A2Aj- Se puede demostrar que esta variable aleatoria 
tiene una distribución de probabilidad llamada distribución ji cuadrada con 2 n grados de li¬ 
bertad (gl) ( v = 2 n, donde v es el parámetro de una distribución ji cuadrada como se men¬ 
ciona en la sección 4.4). La tabla A.7 del apéndice ilustra una curva de densidad ji cuadrada 
típica y tabula valores críticos que capturan áreas de colas específicas. El número pertinen¬ 
te de grados de libertad en este caso es 2(10) = 20. La fila v = 20 de la tabla muestra que 
34.170 captura un área de cola superior de 0.025 y 9.591 captura un área de cola inferior de 
0.025 (área de cola superior de 0.975). Por consiguiente con n = 10, 

P(9.591 < 2Al>,. < 34.170) = 0.95 

La división entre 22A) aísla A y se obtiene 

P(9.591/(2lX) < A < (34.170/(22>,.)) = 0.95 

El límite inferior del intervalo de confianza de 95% para A es 9.591/(22*,) y el límite supe¬ 
rior es 34.170/(22-*,j. Con los datos dados 2 x¡ = 550.87 da el intervalo (0.00871, 0.03101). 
El valor esperado de una variable aleatoria exponencial es /x = 1/A. Puesto que 

P(2l>,/34.170 < 1/A < 2¿>,79.591) = 0.95 

el intervalo de confianza de 95% para el tiempo de ruptura promedio verdadero es 
(2^x,734.170, 22*,79.591) = (32.24, 114.87). Obviamente este intervalo es bastante ancho, 
lo que refleja una variabilidad sustancial de los tiempos de ruptura y un pequeño tamaño de 
muestra. ■ 

En general, los límites de confianza superior e inferior resultan de reemplazar cada 
< en (7.6) por = y resolviendo para 0. En el ejemplo del fluido aislante que se acaba de con¬ 
siderar, 2A2*,- = 34.170 da A = 34.170/(22-',) como límite de confianza superior y el límite 
inferior se obtiene con la otra ecuación. Obsérvese que los dos límites de intervalo no están 
equidistantes de la estimación puntual, en vista de que el intervalo no es de la forma 0 ± c. 

Intervalos de confianza bootstrap 

La técnica bootstrap se introdujo en el capítulo 6 como una forma de estimar cr e . También 
puede ser aplicada para obtener un intervalo de confianza para 0. Considérese de nuevo la 
estimación de la media /x de una distribución normal cuando cr es conocido. Reemplácese 
/x con 0 y úsese 0 = X como estimador puntual. Obsérvese que 1.96cr/Vn es el percentil 97.5 
de la distribución de 0—0 (esto es, P(X — /x < 1.96oA/ñ) = P(Z < 1.96) = 0.9750). 
Del mismo modo -1.96cr/Vn es el percentil 2.5, por consiguiente 

0.95 = P(percentil 2.5 < 0 — 0 < percentil 97.5) 

= P0 — percentil 2.5 > 0 > 0 — percentil 97.5) 

Es decir, con 

1 = 0 — percentil 97.5 de 0 — 0 

„ „ (7.7) 

u = 0 percentil 2.5 de 0 — 0 

El intervalo de confianza para 0 es (/, u ). En muchos casos, los percentiles en (7.7) no pue¬ 
den ser calculados, pero sí pueden serlo con muestras bootstrap. Supóngase que se obtienen 
B = 1000 muestras bootstrap y se calculan 0*, ... , 0* ooo y 0* seguidos por las diferencias 
0 * — 0 *,..., 0* ooo — 0*. Las 25 más grandes y las 25 más pequeñas de estas diferencias son 
estimaciones de los percentiles desconocidos en (7.7). Consúltense los libros de Devore y 
Berk o de Efron citados en el capítulo 6 para más información. 
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262 CAPÍTULO 7 Intervalos estadísticos basados en una sola muestra 

EJERCICIOS Sección 7.1 (1-11) 


1. Considere una distribución de población normal con el va¬ 
lor de a conocido. 

a. ¿Cuál es el nivel de confianza para el intervalo x ± 

2.81o-/Vñ? 

b. ¿Cuál es el nivel de confianza para el intervalo x ± 
1.44o-/Vñ? 

c. ¿Qué valor de z a/2 en la fórmula de intervalo de confian¬ 
za (7.5) da un nivel de confianza de 99.7%? 

d. Responda la pregunta hecha en el inciso c) para un nivel 
de confianza de 75%. 

2. Cada uno de los siguientes intervalos es un intervalo de 
confianza para ¡x = frecuencia de resonancia promedio ver¬ 
dadera (Hz) (es decir, media de la población) para todas las 
raquetas de tenis de un tipo: 

(114.4,115.6) (114.1,115.9) 

a. ¿Cuál es el valor de la frecuencia de resonancia media 
muestral? 

b. Ambos intervalos se calcularon con los mismos datos 
muéstrales. El nivel de confianza para uno de estos inter¬ 
valos es de 90% y para el otro es de 99%. ¿Cuál de los 
intervalos tiene el nivel de confianza de 90% y por qué? 

3. Suponga que se selecciona una muestra de 50 botellas de una 
marca particular de jarabe para la tos y se determina el conte¬ 
nido de alcohol. Sea /x el contenido promedio de alcohol de la 
población de todas las botellas de la marca estudiada. Supon¬ 
ga que el intervalo de confianza de 95% resultante es (7.8,9.4). 

a. ¿Habría resultado un intervalo de confianza de 90% calcu¬ 
lado con esta muestra más angosto o más ancho que el 
intervalo dado? Explique su razonamiento. 

b. Considere la siguiente proposición: Existe 95% de pro¬ 
babilidades de que el /x esté entre 7.8 y 9.4. ¿Es correc¬ 
ta esta proposición? ¿Por qué sí o por qué no? 

c. Considere la siguiente proposición: Se puede estar total¬ 
mente confiado de que 95% de todas las botellas de este 
tipo de jarabe para la tos tienen un contenido de alcohol 
entre 7.8 y 9.4. ¿Es correcta esta proposición? ¿Por qué 
sí o por qué no? 

d. Considere la siguiente proposición: Si el proceso de se¬ 
lección de una muestra de tamaño 50 y de cálculo del in¬ 
tervalo de 95% correspondiente se repite 100 veces, 95 
de los intervalos resultantes incluirán ¡x. ¿Es correcta 
esta proposición? ¿Por qué sí o por qué no? 

4. Se desea un intervalo de confianza para la pérdida por car¬ 
ga parásita promedio verdadera ¡x (watts) de cierto tipo de 
motor de inducción cuando la comente a través de la línea 
se mantiene a 10 amps a una velocidad de 1500 rpm. Su¬ 
ponga que la pérdida por carga parásita está normalmente 
distribuida con cr = 3.0. 

a. Calcule un intervalo de confianza para ¡x de 95% cuando 
n = 25 y x — 58.3. 

b. Calcule un intervalo de confianza para ¡x de 95% cuando 
n = 100 yi= 58.3. 

c. Calcule un intervalo de confianza para ¡x de 99% cuando 
n = 100 yx = 58.3. 


d. Calcule un intervalo de confianza para ¡x de 82% cuando 
n = 100 yx = 58.3. 

e. ¿Qué tan grande debe ser n si el ancho del intervalo de 
99% para ¡x tiene que ser 1.0? 

5. Suponga que la porosidad al helio (en porcentaje) de muestras 
de carbón tomadas de cualquier costura particular está normal¬ 
mente distribuida con desviación estándar verdadera de 0.75. 

a. Calcule un intervalo de confianza de 95% para la poro¬ 
sidad promedio verdadera de una costura si la porosidad 
promedio en 20 especímenes de la costura fue de 4.85. 

b. Calcule un intervalo de confianza de 98% para la poro¬ 
sidad promedio verdadera de otra costura basada en 16 
especímenes con porosidad promedio muestral de 4.56. 

c. ¿Qué tan grande debe ser un tamaño de muestra si el an¬ 
cho del intervalo de 95% tiene que ser de 0.40? 

d. ¿Qué tan grande debe ser un tamaño de muestra para 
calcular la porosidad promedio verdadera dentro de 0.2 
con confianza de 99%? 

6. Con base en pruebas extensas, se sabe que el punto de ceden- 
cia de un tipo particular de varilla de refuerzo de acero suave 
está normalmente distribuido con cr = 100. La composición 
de la varilla se modificó un poco, pero no se cree que la mo¬ 
dificación haya afectado o la normalidad o el valor de cr. 

a. Suponiendo que éste tiene que ser el caso, si una mues¬ 
tra de 25 varillas modificadas dio por resultado un pun¬ 
to de cedencia promedio muestral de 8439 Ib, calcule un 
intervalo de confianza de 90% para el punto de cedencia 
promedio verdadero de la varilla modificada. 

b. ¿Cómo modificaría el intervalo del inciso a) para obte¬ 
ner un nivel de confianza de 92%? 

7. ¿En cuánto se debe incrementar el tamaño de muestra n si 
el ancho del intervalo de confianza (7.5) tiene que ser redu¬ 
cido a la mitad? Si el tamaño de muestra n se incrementa 
por un factor de 25, ¿qué efecto tendrá en el ancho del in¬ 
tervalo? Justifique sus aseveraciones. 

8. Sea aq > 0, aq > 0, con aq + a, = a. Entonces 

p K < ^ < z “ 2 ) =i_ “ 

a. Use esta ecuación para obtener una expresión más gene¬ 
ral para un intervalo de confianza de 100(1 — a)% para 
¡jl del cual el intervalo (7.5) es un caso especial. 

b. Sea a = 0.05 y aq = a/4, aq = 3a/4. ¿Da por resultado 
esto un intervalo más angosto o más ancho que el inter¬ 
valo (7.5)? 

9. a. En las mismas condiciones que aquellas que conducen 

al intervalo (7.5), P[{X - ¡x)/( cr/Vñ ) < 1.645] = 0.95. 
Use esta expresión para obtener un intervalo unilateral 
para ¡x de ancho infinito y que proporcione un límite de 
confianza inferior para ¡x. ¿Cuál es el intervalo para los 
datos del ejercicio 5(a)? 

b. Generalice el resultado del inciso a) para obtener un lí¬ 
mite inferior con nivel de confianza de 100(1 — a)%. 
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c. ¿Cuál es un intervalo análogo al del inciso b) que pro¬ 
porcione un límite superior para p7 Calcule este interva¬ 
lo de 99% para los datos del ejercicio 4(a). 

10. Una muestra aleatoria de n = 15 bombas térmicas de cierto ti¬ 
po produjo las siguientes observaciones de vida útil (en años): 

2.0 1.3 6.0 1.9 5.1 0.4 1.0 5.3 

15.7 0.7 4.8 0.9 12.2 5.3 0.6 

a. Suponga que la distribución de la vida útil es exponen¬ 
cial y use un argumento paralelo al del ejemplo 7.5 para 
obtener un intervalo de confianza de 95% para la vida 
útil esperada (promedio verdadero). 

b. ¿Cómo debería modificarse el intervalo del inciso a) para 
obtener un nivel de confianza de 99%? 


263 

c. ¿Cuál es un intervalo de confianza de 95% para la des¬ 
viación estándar de la distribución de la vida útil? [Suge¬ 
rencia: ¿Cuál es la desviación estándar de una variable 
aleatoria exponencial?] 

11. Considere los siguientes 1000 intervalos de confianza de 
95% para p que un consultor estadístico obtendrá para va¬ 
rios clientes. Suponga que se seleccionan independiente¬ 
mente uno de otro los conjuntos de datos en los cuales están 
basados los intervalos. ¿Cuántos de estos 1000 intervalos 
espera que capturen el valor correspondiente de ¿i? ¿Cuál es 
la probabilidad de que entre 940 y 960 de estos intervalos 
contengan el valor correspondiente de /x? [Sugerencia: Sea 
Y = el número entre los 1000 intervalos que contienen p. 
¿Qué clase de variable aleatoria es F?] 



7.2 Intervalos de confianza de muestra grande 
para una media y proporción de población 


Se supuso en el intervalo de confianza para p dado en la sección previa que la distribución 
de la población es normal con el valor de cr conocido. A continuación se presenta un inter¬ 
valo de confianza de muestra grande cuya validez no requiere estas suposiciones. Después 
de demostrar cómo conduce el argumento a este intervalo se aplica en forma extensa para 
producir otros intervalos de muestra grande y habrá que enfocarse en un intervalo 
para una proporción de población p. 

Intervalo de muestra grande para ¡i 

Sean X¡, X 2 , . . . ,X n una muestra aleatoria de una población con media p y desviación es¬ 
tándar cr. Siempre que n es grande, el teorema del límite central implica que X tiene de ma¬ 
nera aproximada una distribución normal cualquiera que sea la naturaleza de la distribución 
de la población. Se deduce entonces que Z = (X — p)l(crl'Sñ) tiene aproximadamente una 
distribución estándar normal, de modo que 

p {~ Zan < ^vf < z “' 2 ) “ 1 “ “ 

Un argumento paralelo al dado en la sección 7.1 da x ± z a/2 ' crix/ñ como intervalo de 
confianza de muestra grande para p con un nivel de confianza de aproximadamente 
100(1 — a)%. Es decir, cuando n es grande, el intervalo de confianza para p dado antes 
permanece válido cualquiera que sea la distribución de la población, siempre que el califi¬ 
cador esté insertado “aproximadamente” enfrente del nivel de confianza. 

Una dificultad práctica con este desarrollo es que el cálculo del intervalo de confian¬ 
za requiere el valor de cr, el cual rara vez es conocido. Considérese la variable estandariza¬ 
da (X - p)l(SlVñ), en la cual la desviación estándar muestral S ha sido reemplazada a cr. 
Previamente había aleatoriedad sólo en el numerador de Z gracias a X. En la nueva variable 
estandarizada, tanto X como S cambian de valor de una muestra a otra. Así que aparente¬ 
mente la distribución de la nueva variable deberá estar más dispersa que la curva z para re¬ 
flejar la variación extra en el denominador. Esto en realidad es cierto cuando n es pequeño. 
Sin embargo, con n grande la sustitución de S en lugar de cr agrega un poco de variabilidad 
extra, así que esta variable también tiene una distribución normal estándar. La manipulación 
de la variable en la proposición de probabilidad, como en el caso de cr conocida, da un in¬ 
tervalo de confianza de muestra grande general para p. 





















CAPITULO 7 Intervalos estadísticos basados en una sola muestra 


PROPOSICIÓN 


Si n es suficientemente grande, la variable estandarizada 

7 — X /4 

s/V¿ 

tiene aproximadamente una distribución normal estándar. Esto implica que 



(7.8) 


es un intervalo de confianza de muestra grande para ju. con nivel de confianza 
aproximadamente de 100(1 — a)%. Esta fórmula es válida sin importar la forma de 
la distribución de la población. 


En general, n > 40 será suficiente para justificar el uso de este intervalo. Esto es algo más 
conservador que la regla empírica del teorema del límite central debido a la variabilidad adi¬ 
cional introducida por el uso de S en lugar de cr. 

Ejemplo 7.6 El voltaje de ruptura de corriente alterna (CA) de un líquido aislante indica su resistencia die¬ 
léctrica. El artículo “Testing Practices for the AC Breakdown Voltage Testing of Insulation 
Liquids” (IEEE Electrical Insulation Magazine, 1995: 21-26) dio las observaciones muéstra¬ 
les adjuntas de voltaje de ruptura (kV) de un circuito particular en ciertas condiciones. 
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Una gráfica de caja de los datos (figura 7.5) muestra una alta concentración a la mitad de la 
parte media de los datos (ancho de caja angosto). Hay sólo un valor apartado en el extremo 
superior, pero éste en realidad está un poco más cerca de la mediana (55) que la observa¬ 
ción muestral más pequeña. 
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Figura 7.5 Gráfica de los datos de voltaje de ruptura del ejemplo 7.6. 


Las cantidades resumidas incluyen n = 48, Zq = 2626 y Z-«7 = 144950, a partir de 
las cuales x = 54.7 y s = 5.23. El intervalo de confianza de 95% es entonces 

5 23 

54.7 ± = 54.7 ± 1.5 = (53.2, 56.2) 

Es decir, 

53.2 <ijl< 56.2 


con un nivel de confianza de aproximadamente 95%. El intervalo es angosto de manera ra¬ 
zonable, lo que indica que /j, ha sido estimada con precisión. ■ 
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Desafortunadamente, la selección del tamaño de muestra para que dé un ancho de in¬ 
tervalo deseado no es simple en este caso como lo fue en el caso de cr conocida. Por eso el 
ancho de (7.8) es 2 z a pstxfri. Como el valor de s no está disponible antes de que los datos 
hayan sido recopilados, el ancho del intervalo no puede ser determinado tan sólo con la se¬ 
lección de tí. La única opción de un investigador que desea especificar el ancho deseado es 
hacer una suposición instruida a qué valor de s podría ser. Siendo conservador y suponien¬ 
do un valor más grande de s, se seleccionará un n más grande de lo necesario. El investiga¬ 
dor puede ser capaz de especificar un valor razonablemente preciso del rango de población 
(la diferencia entre los valores más grande y más pequeño). Entonces si la distribución de 
la población no es demasiado asimétrica, si se divide el rango entre 4 se obtiene un valor 
aproximado de lo que ,v podría ser. 

Remítase al ejemplo 7.6 sobre voltaje de ruptura. Suponga que el investigador cree que vir¬ 
tualmente todos los valores en la población se encuentran entre 40 y 70. Entonces (70 - 
40)/4 = 7.5 da un valor razonable para .v. El tamaño de muestra apropiado para estimar el 
voltaje de ruptura promedio verdadero a dentro de 1 kV con nivel de confianza de 95%, es 
decir, para que el intervalo de confianza de 95% tenga un ancho de 2 kV, es 

77 = [(1.96)(7.5)/1] 2 = 217 ■ 

Un intervalo de confianza de muestra grande general 

Los intervalos de muestra grande x ± z na ’ crl\/n y i ± z a / 2 • s/Vñ son casos especiales de un 
intervalo de confianza de muestra grande general para un parámetro 0. Suponga que 0 es un es¬ 
timador que satisface las siguientes propiedades: 1) Tiene aproximadamente una distribución 
normal; 2) es insesgado (por lo menos aproximadamente); y 3) una expresión para erg, la des¬ 
viación estándar de 0, está disponible. Por ejemplo, en el caso 6 = p,, ¡1 = X es un estimador 
insesgado cuya distribución es aproximadamente normal cuando n es grande y cr^ = oj = 
cr/Vn. Estandarizando 6 se obtiene la variable aleatoria Z = (0 — 0 )/crg, la cual tiene aproxima¬ 
damente una distribución normal estándar. Esto justifica la proposición de probabilidad 

/ 0-0 \ 

P \ Zal2 K —¿7 < Za/2 j “ 1 ~ “ (7 ' 9) 

Suponga, primero, que erg parámetros desconocidos (p. ej., cr conocida en el caso 0 = p). 
Entonces si se reemplaza cada < en (7.9) por = se obtiene 0 = 0 ± z nl2 ■ erg, por consiguiente 
los límites de confianza inferior y superior son 0 — z a/2 ’ erg y 0 + z a/2 ■ erg, respectivamente. 
Suponga ahora que erg no implica 0 pero sí implica por lo menos otro parámetro desconoci¬ 
do. Sea sg la estimación de erg obtenido utilizando estimaciones en lugar de los parámetros 
desconocidos (p. ej., s/X'Ti estima ctA/h). En condiciones generales (esencialmente que sg 
se aproxime a erg con la mayoría de las muestras), un intervalo de confianza válido es 0 ± 
z a/2 • sg. El intervalo muestral grande x ± z a¡2 • .v/V n es un ejemplo. 

Por último, suponga que erg no implica el 0 desconocido. Este es el caso, por ejemplo, 
cuando 0 = p, una proporción de población. Entonces (6 — 0)/crg = z a/2 puede ser difícil de 
resolver. Con frecuencia se puede obtener una solución aproximada reemplazando 0 en erg 
por su estimación 0. Esto da una desviación estándar estimada sg y el intervalo correspon¬ 
diente es de nuevo 0 ± z a/2 ■ Sg. 

Un intervalo de confianza para una proporción 
de población 

Sea p la proporción de “éxitos” en una población, donde éxito identifica a un individuo u 
objeto que tiene una propiedad específica (p. ej., individuos que se graduaron en una uni¬ 
versidad, computadoras que no requieren servicio de garantía, etc.). Una variable aleatoria 
de 77 individuos que tiene que ser seleccionada y X es el número de éxitos en la muestra. 
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Siempre que n sea pequeño comparado con el tamaño de la població n, X puede ser conside¬ 
rada como una variable aleatoria binomial con E{X) = np y <r x = V np(\ — p). Además, si 
tanto np > 10 como nq > 10. X tiene aproximadamente una distribución normal. 

El estimador natural de p es p = X/n, la fracción muestral de éxitos. Como p es 
simplemente X multiplicada por la constante Un, p también tiene aproximadamente una 
distribu ción norma l. Como se muestra en la sección 6.1, E(p ) = p (insesgamiento) y 
<r ; - = X p( 1 — p)/n. La desviación estándar cr- implica el parámetro desconocido p. Si se es¬ 
tandariza p restando p y dividiendo entre cr- p entonces se tiene 


Procediendo como se sugirió en la subsección “Derivación de un intervalo de confian¬ 
za” (sección 7.1), los límites de confianza se obtienen al reemplazar cada < por = y resol¬ 
ver la ecuación cuadrática resultante para p. Esto da las dos raíces 


1 + 2n ~ Zal2 


pq_ 

n 


4 n 2 


1 + (z 2 „)/n 



PROPOSICIÓN 


Un intervalo de confianza para una proporción de poblad» 

fianza aproximadamente de 100(1 — a)% tiene 

^ + 77 z “ /2 J 

>n p con nivel de con- 

/pg ! 4/2 

n 4n 2 

1 + (zln 
y 

^ + ibf + Zal2 v/ 

)/n 

(7.10) 

/pg , 4/2 

n 4 n 2 

1 + (4/2 

)/n 



Si el tamaño de muestra es bastante grande, z 2 /(2n) es insignificante comparado con p, 
Z 2 /(4n 2 ), bajo la raíz cuadrada es insignificante comparado con pq/n y z 2 /n es insignificante 
comparado con 1. Si se desechan estos términos insignificantes se obtienen los límites de 
confianza aproximados 

P ± z a , 2 VMTn (7.11) 

Esta es la forma general 0 ± z a/2 «y de un intervalo de muestra grande sugerido en la última 
subsección. Por décadas este último intervalo ha sido recomendado en tanto la aproxima¬ 
ción normal para p se justifique. Sin embargo, investigaciones recientes han demostrado que 
el intervalo un poco más complicado dado en la proposición tiene un nivel de confianza real 
que tiende a acercarse más al nivel nominal que el intervalo tradicional (Agresti, Alan y 
Coull, “Approximate Is Better Than ‘Exact’ for Interval Estimation of a Binomial Propor- 
tion”, The American Statistician, 1998: 119-126). Es decir, si se utiliza z a/2 = 1.96, el nivel 
de confianza para el “nuevo” intervalo tiende a acercarse más a 95% con casi todos los va¬ 
lores de p que en el caso del intervalo tradicional; esto también es cierto con otros niveles 
de confianza. Además, Agresti y Coull proponen que el intervalo “puede ser recomendado 
para usarse con casi todos los tamaños de muestra y valores de parámetro” por lo que las 
condiciones np > 10 y nq > 10 no tienen que ser verificadas. 
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El artículo “Repeatability and Reproducibility for Pass/Fail Data” (J. ofTesting and Eval., 
1997: 151-153) reportó que en n = 48 ensayos en un laboratorio particular, 16 dieron por 
resultado la ignición de un tipo particular de sustrato por un cigarrillo encendido. Sea p la 
proporción a largo plazo de tales ensayos que producirían ignición. Una estimación puntual 
de p es p = 16/48 = 0.333. Un intervalo de confianza para p con un nivel de confianza de 
aproximadamente 95% es 


0.333 + (1.96) 2 /96 ± 1.96\/(0.333)(0.667)/48 + (1.96) 2 /9216 
1 + (1.96) 2 /48 


0.373 ± 0.139 
1.08 


(0.217, 0.474) 


El intervalo tradicional es 

0.333 ± 1.96 V(0-333)(0.667)/48 = 0.333 ± 0.133 = (0.200, 0.466) 

Estos dos intervalos concordarían mucho más si el tamaño de muestra fuera sustancialmen¬ 
te más grande. ■ 


Si se iguala al ancho del intervalo de confianza para p al ancho preespecificado w se 
obtiene una ecuación cuadrática para el tamaño de muestra n necesario para dar un interva¬ 
lo con un grado de precisión deseado. Si se suprime el subíndice en z a/2 , la solución es 

2 z 2 pq ~ Z 2 w 2 ± V4z A pq(pq — w 2 ) + w 2 z 4 

n = - - - (7.12) 

w ¿ 

Omitiendo los términos en el numerador que implican w 2 se obtiene 

__ 4 z 2 pq 
n ~ — L - L - 

w 2 

Esta última expresión es lo que resulta de igualar el ancho del intervalo tradicional a w. 

Estas fórmulas desafortunadamente implican la p desconocida. El método más con¬ 
servador es aprovechar el hecho de que pq [= p( i — /))] es un máximo cuando p = 0.5. 
Por consiguiente si se utiliza/) = q = 0.5 en (7.12), el ancho será cuando mucho w hacien¬ 
do caso omiso de que el valor de p resulte de la muestra. De manera alternativa, si el inves¬ 
tigador cree de manera firme, basado en información previa, que p < p 0 < 0.5, en ese caso 
se utiliza p Q en lugar de p. Un comentario similar es válido cuando p > p 0 > 0.5. 

El ancho del intervalo de confianza de 95% en el ejemplo 7.8 es 0.257. El valor de n nece¬ 
sario para garantizar un ancho de 0.10 independientemente del valor de p es 


= 2(1.96) 2 (0.25) - (1.96) 2 (0.01) ± V4(1.96) 4 (0.25)(0.25 - 0.01) + (0.01)(1.96) 4 = 3g() 3 

0.01 


Por consiguiente se deberá utilizar un tamaño de muestra de 381. La expresión para n basa¬ 
da en el intervalo de confianza tradicional da un valor un poco más grande de 385. ■ 

Intervalos de confianza unilaterales 
(límites de confianza) 

Los intervalos de confianza discutidos hasta ahora dan tanto un límite de confianza inferior 
como uno superior para el parámetro que se está estimando. En algunas circunstancias, es 
posible que un investigador desee sólo uno de estos dos tipos de límites. Por ejemplo, es po¬ 
sible que un psicólogo desee calcular un límite de confianza superior de 95% para el tiempo 
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de reacción promedio verdadero a un estímulo particular o es posible que un ingeniero de 
confiabilidad desee sólo un límite de confianza inferior para la vida útil promedio de com¬ 
ponentes de un tipo. Como el área acumulativa bajo la curva normal estándar a la izquierda 
de 1.645 es de 0.95, 

Klv? < H - 095 

Si se manipula la desigualdad entre el paréntesis para aislar p en un lado y reemplazan las 
variables aleatorias con valores calculados se obtiene la desigualdad p > x — 1.645sA/n; 
la expresión a la derecha es el límite de confianza inferior deseado. Comenzando con 
P(-1.645 < Z) ~ 0.95 y manipulando la desigualdad se obtiene el límite de confianza superior. 
Un argumento similar da un límite unilateral asociado con cualquier otro nivel de confianza. 


PROPOSICIÓN 


Un límite de confianza superior muestral grande para p es 


p <x + z a 


y un límite de confianza inferior muestral grande para p es 

M > X - Z a • T7= 


Se obtiene un límite de confianza unilateral para p reemplazando z a/2 en lugar de 
z a y ± en lugar de + o - en la fórmula para el intervalo de confianza (7.10) para p. 
En todos los casos, el nivel de confianza es aproximadamente de 100( 1 — «)%. 




Ejemplo 7.10 La prueba de esfuerzo cortante es el procedimiento más aceptado de evaluar la calidad de 
una unión entre un material de reparación y su sustrato de concreto. El artículo “Testing the 
Bond Between Repair Materials and Concrete Substrate” (ACIMaterials J., 1996: 553-558) 
reportó que en una investigación particular, una muestra de 48 observaciones de resistencia 
al esfuerzo cortante dio una resistencia media muestral de 17.17 N/mm 2 y una desviación 
estándar muestral de 3.28 N/mm 2 . Un límite de confianza inferior para la resistencia al es¬ 
fuerzo cortante promedio verdadera p con nivel de confianza de 95% es 


17.17 - (1.645) 


(3.28) 

V48 


= 17.17 - 0.78 = 16.39 


Es decir, con un nivel de confianza de 95%, el valor de p queda en el intervalo (16.39, °°). 


O 


EJERCICIOS Sección 7.2 (12-27) 


12. Una muestra aleatoria de 110 relámpagos en cierta región 
dieron por resultado una duración de eco de radar promedio 
muestral de 0.81 segundos y una desviación estándar mues¬ 
tral de 0.34 segundos (“Lightning Strikes to an Airplane in a 
Thunderstorm”, J. ofAircraft , 1984: 607-611). Calcule un in¬ 
tervalo de confianza de 99% (bilateral) para la duración de 
eco promedio verdadera p e interprete el intervalo resultante. 

13. El artículo “Gas Cooking, Kitchen Ventilation, and Expo- 
sure to Combustión Products” (Indoor Air, 2006: 65-73) 
reportó que para una muestra de 50 cocinas con estufas de 
gas monitoreadas durante una semana, el nivel de CO, me¬ 


dio muestral (ppm) fue de 654.16 y la desviación estándar 
muestral fue de 164.43. 

a. Calcule e interprete un intervalo de confianza de 95% 
(bilateral) para un nivel de CO, promedio verdadero en 
la población de todas las casas de la cual se seleccionó la 
muestra. 

b. Suponga que el investigador había hecho una suposición 
preliminar de 175 para el valor de la s antes de recopilar 
los datos. ¿Qué tamaño de muestra sería necesario para 
obtener un ancho de intervalo de 50 ppm para un nivel 
de confianza de 95%? 
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14. El artículo "Evaluating Tunnel Kiln Performance” ( Amer. 
Ceramic Soc. Bull., agosto de 1997: 59-63) reportó la si¬ 
guiente información resumida sobre resistencias a la fractu¬ 
ra (MPa) de n = 169 barras de cerámica horneadas en un 
horno particular: x = 89.10, i = 3.73. 

a. Calcule un intervalo de confianza (bilateral) para la resis¬ 
tencia a la fractura promedio verdadera utilizando un nivel 
de confianza de 95%. ¿Se podría decir que la resistencia a 
la fractura promedio verdadera fue estimada con precisión? 

b. Suponga que los investigadores creyeron a priori que la 
desviación estándar de la población era aproximada¬ 
mente de 4 MPa. Basado en esta suposición, ¿qué tan 
grande tendría que ser una muestra para estimar p hasta 
dentro de 0.5 MPa con 95% de confianza? 

15. Determine el nivel de confianza de cada uno de los siguien¬ 
tes límites de confianza unilaterales muéstrales grandes: 

a. Límite superior: x + 0.84 .s/Vñ 

b. Límite inferior: x — 2.05 s/s/ñ 

c. Límite superior: x + 0.675/Vñ 

16. El tiempo desde la carga hasta el vaciado (min) de un ace¬ 
ro al carbono en un tipo de horno Siemens-Martin se deter¬ 
minó para cada hornada en una muestra de tamaño 46 y el 
resultado fue un tiempo medio muestral de 382.1 y una des¬ 
viación estándar muestral de 31.5. Calcule un límite de con¬ 
fianza superior de 95% para el tiempo de carga a vaciado 
promedio verdadero. 

17. El ejercicio 1.13 dio una muestra de observaciones de resis¬ 
tencia última a la tensión (klb/pulg 2 ). Use los datos de salida 
estadísticos descriptivos adjuntos de MINITAB para calcular 
un límite de confianza inferior de 99% para la resistencia a la 
tensión última promedio verdadera e interprete el resultado. 

N Media Mediana MediaTrDesvEstand MedianaSE 
153 135.39 135.40 135.41 4.59 0.37 

Mínimo Máximo Q1 Q3 

122.20 147.70 132.95 138.25 

18. El artículo “Ultímate Load Capacities of Expansión Anchor 
Bolts” ( J. of Energy Engr., 1993: 139-158) reportó los si¬ 
guientes datos resumidos sobre resistencia al esfuerzo cortan¬ 
te (klb/pulg 2 ) para una muestra de pernos de anclaje de 3/8 
pulg: n = 78, x = 4.25, s = 1.30. Calcule un límite de con¬ 
fianza inferior utilizando un nivel de confianza de 90% para 
una resistencia al esfuerzo cortante promedio verdadero. 

19. El artículo “Limited Yield Estimation for Visual Defect 
Sources” ( IEEE Trans. on Semiconductor Manuf, 1997: 
17-23) reportó que, en un estudio de un proceso de inspec¬ 
ción de obleas particular, 356 troqueles fueron examinados 
por una sonda de inspección y 201 de éstos pasaron la prue¬ 
ba. Suponiendo un proceso estable, calcule un intervalo de 
confianza (bilateral) de 95% para la proporción de todos los 
troqueles que pasan la prueba. 

20. La Prensa Asociada (9 de octubre de 2002) reportó que en 
una encuesta de 4722 jóvenes estadounidenses de 6 a 19 años 
de edad, 15% sufría de problemas serios de sobrepeso (un ín¬ 
dice de masa corporal de por lo menos 30; este índice mide 
el peso con respecto a la estatura). Calcule e interprete un in¬ 
tervalo de confianza utilizando un nivel de confianza de 99% 
para la proporción de todos los jóvenes estadounidenses con 
un problema de sobrepeso serio. 


Se seleccionó una muestra aleatoria de 539 familias de una 
ciudad del medio oeste y se determinó que 133 de éstas po¬ 
seían por lo menos un arma de fuego (“The Social Determi- 
nants of Gun Ownership: Self-Protection in an Urban 
Environment”, Criminology, 1997: 629-640). Utilizando un 
nivel de confianza de 95%, calcule un límite de confianza 
inferior para la proporción de todas las familias en esta ciu¬ 
dad que poseen por lo menos un arma de fuego. 

22. Se seleccionó una muestra aleatoria de 487 mujeres no fuma¬ 
doras de peso normal (índice de masa corporal entre 19.8 y 
26.0) que había dado a luz en un gran centro médico metro¬ 
politano ("The Effects of Cigarette Smoking and Gestatio- 
nal Weight Change on Birth Outcomes in Obese and Normal 
Weight Women”, Amer. J. of Public Health, 1997: 591-596). 
Se determinó que 7.2% de estos nacimientos dieron por resul¬ 
tado niños con bajo peso al nacer (menos de 2500 g). Calcule 
un límite de confianza superior utilizando un nivel de confian¬ 
za de 99% para la proporción de todos esos nacimientos que 
dieron por resultado niños de bajo peso al nacer. 

23. El artículo “An Evaluation of Football Helmets Under Im- 
pact Conditions” {Amer. J. Sports Medicine, 1984: 233- 
237) reporta que cuando cada casco de fútbol en una 
muestra aleatoria de 37 cascos de tipo suspensión se some¬ 
tieron a una prueba de impacto, 24 mostraron daños. Sea p 
la proporción de todos los cascos de este tipo que mostraría 
daños cuando se someten a prueba de la manera prescrita. 

a. Calcule un intervalo de confianza de 99% para p. 

b. ¿Qué tamaño de muestra se requeriría para que el ancho 
de un intervalo de confianza de 99% sea cuando mucho de 
0.10, independientemente dep? 

24. Una muestra de 56 muestras de algodón produjo un porcen¬ 
taje de alargamiento promedio muestral de 8.17 y una des¬ 
viación estándar de 1.42 (“An Apparent Relation Between 
the Spiral Angle 4>, the Percent Elongation E v and the Di- 
mensions of the Cotton Fiber”, Textile Research 1978: 
407-410). Calcule un intervalo de confianza de 95% mues¬ 
tral grande para el porcentaje de alargamiento promedio 
verdadero p. ¿Qué suposiciones está haciendo sobre la dis¬ 
tribución del porcentaje de alargamiento? 

25. Una legisladora estatal desea encuestar a los residentes de su 
distrito para ver qué proporción del electorado está cons¬ 
ciente de su posición sobre la utilización de fondos estatales 
para solventar abortos. 

a. ¿Qué tamaño de muestra es necesario si el intervalo de 
confianza de 95% para p debe tener un ancho de cuando 
mucho 0.10 independientemente de p? 

b. Si la legisladora está firmemente convencida de que por 
lo menos | del electorado conoce su posición, ¿qué ta¬ 
maño de muestra recomendaría? 

26. El superintendente de un gran distrito escolar, que una ocasión 

tomó un curso de probabilidad y estadística, cree que el núme¬ 
ro de maestros ausentes en cualquier día dado tiene una distri¬ 
bución de Poisson con parámetro A. Use los datos adjuntos 
sobre ausencias durante 50 días para obtener un intervalo de 
confianza muestral grande para A. [Sugerencia: La media y la 
varianza de una variable de Poisson son iguales a A, por con¬ 
siguiente _ 
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tiene aproximadamente una distribución normal estándar. 
Ahora prosiga como en la derivación del intervalo para p 
haciendo una proposición de probabilidad (con probabili¬ 
dad de 1 — a) y resolviendo las desigualdades resultantes 
para A (véase el argumento exactamente después de (7.10)).] 
Número de 

ausencias 012 3456789 10 


Frecuencia 148 10 875321 1 


27. Reconsidere el intervalo de confianza (7.10) para p y enfó- 
quese en un nivel de confianza de 95%. Demuestre que los 
límites de confianza concuerdan bastante bien con los del 
intervalo tradicional (7.11) una vez que dos éxitos y dos 
fallas se anexaron a la muestra [es decir, (7.11) basado en 
x + 2 éxitos ( S) en n + 4 ensayos]. [Sugerencia: 1.96 ~ 2. 
Nota: Agresti y Coull demostraron que este ajuste del inter¬ 
valo tradicional también tiene un nivel de confianza próxi¬ 
mo al nivel nominal.] 


7.3 Intervalos basados en una distribución 
de población normal 


El intervalo de confianza para p presentado en la sección 7.2 es válido siempre que n es 
grande. El intervalo resultante puede ser utilizado cualquiera que sea la naturaleza de la dis¬ 
tribución de la población. El teorema del límite central no puede ser invocado, sin embargo, 
cuando n es pequeña. En este caso, una forma de proceder es hacer una suposición específi¬ 
ca sobre la forma de la distribución de la población y luego obtener un intervalo de confian¬ 
za adecuado a esa suposición. Por ejemplo, se podría desarrollar un intervalo de confianza 
para p, cuando una distribución gama describe la población, otro para el caso de una pobla¬ 
ción Weibull, y así sucesivamente. Estadísticos en realidad han realizado este programa para 
varias familias distribucionales diferentes. Como la distribución normal es más frecuente¬ 
mente apropiada como modelo de una población que cualquier otro tipo de distribución, la 
atención aquí se concentrará en un intervalo de confianza para esta situación. 




SUPOSICIÓN 


La población de interés es normal, de modo que Aj, . . . , X n constituyen una muestra 
aleatoria tomada de una distribución normal con p y cr desconocidas. 


O 


El resultado clave que sustenta el intervalo de la sección 7.2 fue que con n grande, la 
variable aleatoria Z = (X — p)/(S/\ ,r n) tiene aproximadamente una distribución normal es¬ 
tándar. Cuando n es pequeño, no es probable que S se aproxime a cr, de modo que la varia¬ 
bilidad de la distribución de Z surge la aleatoriedad tanto en el numerador como en el 
denominador. Esto implica que la distribución de probabilidad de (X — pj/iS/Vn.) se dis¬ 
persará más que la distribución normal estándar. El resultado en el cual están basadas las in¬ 
ferencias introduce una nueva familia de distribuciones de probabilidad llamada familia de 
distribuciones t. 


TEOREMA 


Cuando X es la media de una muestra aleatoria de tamaño n tomada de una distribu¬ 
ción normal con media p, la variable aleatoria 


T = 


X-p 

s/V7i 


(7.13) 


tiene una distribución de probabilidad llamada distribución t con n - 1 grados de li¬ 
bertad (gl). 


Propiedades de distribuciones t 

Antes de aplicar este teorema, se impone una discusión de propiedades de distribuciones t. 
Aunque la variable de interés sigue siendo (A — p)/(S/\/ñ), ahora se denota por T para re¬ 
calcar que no tiene una distribución normal estándar cuando n es pequeña. Recuérdese que 
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una distribución normal está regida por dos parámetros, la media ¡x y la desviación estándar 
cr. Una distribución t está regida por sólo un parámetro, llamado número de grados de li¬ 
bertad de la distribución, abreviado como gl. Este parámetro se denota con la letra griega 
v. Posibles valores de v son los enteros positivos 1, 2, 3, . . . Cada diferente valor del pará¬ 
metro v corresponde a una distribución t diferente. 

Con cualquier valor fijo del parámetro v, la función de densidad que especifica la 
curva t asociada tiene una apariencia incluso más complicada que la función de densidad 
normal. Afortunadamente, sólo hay que ocuparse de algunas de las más importantes carac¬ 
terísticas de estas curvas. 


Propiedades de distribuciones f 

Sea t v , la curva de función de densidad para el grado de libertad v. 

1. Cada curva t v tiene forma de campana y con su centro en 0. 

2. Cada curva t v está más esparcida que la curva (z) normal estándar. 

3. Conforme v se incrementa, la dispersión de t v correspondiente disminuye. 

4. A medida que v -» °°, la secuencia de curvas t v tiende a la curva normal estándar 
(así que la curva z a menudo se llama curva t con grado de libertad = °°). 


La figura 7.6 ilustra varias de estas propiedades con valores seleccionados de v. 



Figura 7.6 Curvas t v y z. 


El número de grados de libertad con T en (7.13) es n — 1 porque, aunque S está basa¬ 
da en las n desviaciones X¡ — X, . . . ,X n — X, Y,(X¡ — X) = 0 implica que sólo n - 1 de és¬ 
tas están “libremente determinadas”. El número de grados de libertad para una variable t es 
el número de desviaciones libremente determinadas en las cuales está basada la desviación 
estándar estimada en el denominador de T. 

Como se desea utilizar T para obtener un intervalo de confianza del mismo modo que 
Z fue previamente utilizada, es necesario establecer una notación análoga a z a para la distri¬ 
bución t. 


Notación 

Sea t a v = el número sobre el eje de medición con el cual el área bajo la curva t con 
v grados de libertad a la derecha de t a v es a\ t av se llama valor crítico t. 
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Esta notación se ilustra en la figura 7.7. La tabla A.5 del apéndice da t a „ con valores selec¬ 
cionados de a y v. Esta tabla también aparece en el interior de la tapa posterior. Las colum¬ 
nas de la tabla corresponden a diferentes valores de a. Para obtener í 005 15 , hay que ir a la 
columna a = 0.05, buscar hacia abajo en la fila v = 15 y leer f 005 15 = 1.753. Asimismo, 
íq os 22 = 1-717 (columna 0.05, fila v = 22) y í 0 oí 22 = 2.508. 


Curva L, 




Área sombreada = a 


Figura 7.7 Definición pictórica de t av . 


Los valores de t a v exhiben un comportamiento regular al recorrer una fila o al descen¬ 
der por una columna. Con v fijo, t a v se incrementa a medida que a disminuye, puesto que 
hay que moverse más a la derecha de cero para capturar el área a en la cola. Con a fija, a 
medida que v se incrementa (es decir, cuando se recorre hacia abajo cualquier columna par¬ 
ticular de la tabla i) el valor de t a v disminuye. Esto es porque un valor más grande de v im¬ 
plica una distribución t con dispersión más pequeña, de modo que no es necesario ir más 
lejos de cero para capturar el área de cola a. Además, t a „ disminuye más lentamente a me¬ 
dida que v se incrementa. Por consiguiente, los valores que aparecen en la tabla se muestran 
en incrementos de 2 entre 30 y 40 grados de libertad y luego saltar a v = 50, 60, 120 y por 
último °°. Como t m es la curva normal estándar, los valores z a conocidos aparecen en la úl¬ 
tima fila de la tabla. La regla empírica sugería con anterioridad que el uso del intervalo de 
confianza muestral grande (si n > 40) proviene de la igualdad aproximada de las distribu¬ 
ciones normales estándar y t con v > 40. 


Intervalo de confianza t para una muestra 

La variable estandarizada T tiene una distribución t con n - 1 grados de libertad y el área 
bajo la curva de densidad t correspondiente entre -t a/2n - ¡ y t n/2n , es 1 — a (el área al 2 que¬ 
da en cada cola), por consiguiente 

p ( - W-1 <T< W-i) = 1 _ « ( 7 - 14 > 

La expresión (7.14) difiere de las expresiones que aparecen en secciones previas en que T y 
t a , 2 | se utilizan en lugar de Z y z a/2 , aunque pueden ser manipuladas de la misma manera 

para obtener un intervalo de confianza para /a,. 



PROPOSICIÓN 


Sean 3c y s la media y la desviación estándar muéstrales calculadas con los resultados 
de una muestra aleatoria tomada de una población normal con media /a,. Entonces un 

intervalo de confianza de 100(1 — á)% para p. es 

_ ta/2,n-l ‘ ^ j ( 7 -15) 

o, más compactamente, x ± t a/2n _ l • s/\rn. 

Un límite de confianza superior para fi es 


x + L 


y reemplazando + por — en la última expresión se obtiene un límite de confianza in¬ 
ferior para fi, ambos con nivel de confianza de 100(1 — a)%. 
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Como parte de un proyecto más grande para estudiar el comportamiento de paneles de re¬ 
vestimiento sometidos a esfuerzo, un componente estructural extensamente utilizado en Es¬ 
tados Unidos, el artículo “Time-Dependent Bending Properties of Lumber” (J. of Testing 
and Eval., 1996: 187-193) reportó sobre varias propiedades mecánicas de especímenes de 
madera de pino escocés. Considere las siguientes observaciones de módulo de elasticidad 
(MPa) obtenidas un minuto después de cargar una configuración: 

10490 16620 17 300 15 480 12970 17 260 13 400 13 900 

13630 13260 14 370 11700 15470 17840 14070 14760 

La figura 7.8 muestra un diagrama de probabilidad normal obtenido con R. La rectitud del 
diagrama apoya fuertemente la suposición de que la distribución de la población del módu¬ 
lo de elasticidad es por lo menos aproximadamente normal. 
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Figura 7.8 Diagrama de probabilidad normal de los datos de módulo de elasticidad. 

El cálculo manual de la media y la desviación estándar muéstrales se simplifica res¬ 
tando 10 000 de cada observación: y¡ = x¡ — 10 000. Es fácil verificar que Xv, = 72520 y 
'Zyj = 392083 800, de donde y = 4532.5 y s y = 2055.67. Por consiguiente x = 14532.5 
y s x = 2055.67 (el sumar o restar la misma cantidad de cada observación no afecta la variabi¬ 
lidad). El tamaño de muestra es 16, así que un intervalo de confianza para el módulo de elas¬ 
ticidad medio de la población está basado en 15 grados de libertad. Un nivel de confianza de 
95% para un intervalo bilateral requiere el valor crítico t de 2.131. El intervalo resultante es 

í 2055.67 

x — * 0 . 025 , 15 ' ~ 14532.5 ± (2.131) 

= 14532.5 ± 1095.2 = (13437.3, 15 627.7) 

Este intervalo es bastante ancho tanto debido al tamaño de muestra pequeño como por la 
gran cantidad de variabilidad de la muestra. Un límite de confianza inferior de 95% se ob¬ 
tiene utilizando — y 1.753 en lugar de ± y 2.131, respectivamente. ■ 

Por desgracia, no es fácil seleccionar n para controlar el ancho del intervalo t. Esto es 
porque el ancho implica la s desconocida (antes de recopilar los datos) y porque n ingresa 
no sólo a través de l/Vñ sino también a través de t a/2n _ v Por consiguiente, se puede obte¬ 
ner una n apropiada sólo mediante ensayo y error. 

En el capítulo 15, se discutirá un intervalo de confianza de muestra pequeña para /a 
que es válido siempre que sólo la distribución de la población sea simétrica, una suposi¬ 
ción más débil que la de normalidad. No obstante, cuando la distribución de la población 
es normal, el intervalo t tiende a acortarse más de lo que lo haría cualquier otro intervalo 
con el mismo nivel de confianza. 


Diagrama Q-Q normal 



Cuartiles teóricos 
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Un intervalo de predicción para un solo valor futuro 

En muchas aplicaciones, un investigador desea predecir un solo valor de una variable que tie¬ 
ne que ser observada en un tiempo futuro, en lugar de estimar el valor medio de dicha variable. 

Ejemplo 7.12 Considere la siguiente muestra de contenido de grasa (en porcentaje) de n = 10 perros ca¬ 
lientes seleccionados al azar (“Sensory and Mechanical Assessment of the Quality of Frank- 
furters”, J. Texture Studies, 1990: 395-409): 

25.2 21.3 22.8 17.0 29.8 21.0 25.5 16.0 20.9 19.5 

Suponiendo que estas observaciones se seleccionaron de una distribución de población nor¬ 
mal, un intervalo de confianza de 95% para (estimación del intervalo de) el contenido de 
grasa medio de la población es 

x — ^ 0 . 025,9 ‘ = 21-90 ± 2.262 • = 21.90 ± 2.96 

= (18.94, 24.86) 

Suponga, sin embargo, que se va a comer un solo perro caliente de este tipo y desea prede¬ 
cir el contenido de grasa resultante. Una predicción puntual , análoga a una estimación pun¬ 
tual, es simplemente x = 21.90. Esta predicción desafortunadamente no da información 
sobre confiabilidad o precisión. ■ 


El escenario general es como sigue. Se dispondrá de una muestra aleatoria Zj, X 2 ,, 
X n tomada de una distribución de población normal y se desea predecir el valor de X n+l una 
sola observación futura. Un predictor puntual es X y el error de predicción resultante es 
X — X n+y El valor esperado del error de predicción es 

E(X - X n+1 ) = E(X) - E(X n+l ) = il-/jl = 0 

Como X n+1 , es independiente de Z 1; . . . , X n , es independiente de X, así que la varianza del 
error de predicción es 

V(Z - X n+l ) = V(X) + V(X n+ l ) = ^- +a 2 = a 2 ^ + ^ 

El error de predicción es una combinación lineal de variables aleatorias independientes nor¬ 
malmente distribuidas, así que también está normalmente distribuido. Por consiguiente 


Z = 


(Z-Z„ +1 )-Q 


z - z„ 


a 2 1 + 


cr 2 1 + 


tiene una distribución normal estándar. Se puede demostrar que si se reemplaza cr con la 
desviación estándar muestral S (de Z¡, . . . , X n ) se obtiene 


X - X n+l 

T = — ¡ ~ distribución t con n — 1 grados de libertad 

S 1 + - 
\ n 

Si se manipula esta variable T como se manipuló T = (Z — /uj/(.S7 V / ñ) en el desarrollo de 
un intervalo de confianza se obtiene el siguiente resultado. 



PROPOSICIÓN 


Un intervalo de predicción (IP) para una sola observación que tiene que ser selec¬ 
cionado de una distribución de población normal es 

X ± t a/ 2j „-i ‘ S i 1 + “ ( ? ' 16 ) 

El nivel de predicción es 100(1 — a)%. 
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La interpretación de un nivel de predicción de 95% es similar a la de un nivel de confianza 
de 95%; si se calcula el intervalo (7.16) para muestra tras muestra, a la larga 95% de estos 
intervalos incluirán los valores futuros correspondientes de X. 

Ejemplo 7.13 

(continuación 
del ejemplo 
7.12) 


El intervalo es bastante ancho, lo que indica una incertidumbre sustancial en cuanto al con¬ 
tenido de grasa. Obsérvese que el ancho del intervalo de predicción es más de tres veces el 
del intervalo de confianza. ■ 

El error de predicción es X — X n+1 , la diferencia entre dos variables aleatorias, en tan¬ 
to que el error de estimación es X — ¡jl, la diferencia entre una variable aleatoria y un valor 
fijo (aunque desconocido). El intervalo de predicción es más ancho que el intervalo de con¬ 
fianza porque hay más variabilidad en el error de predicción (debido a X n+l ) que en el error 
de estimación. De hecho, a medida que n se hace arbitrariamente grande, el intervalo de con¬ 
fianza se contrae a un solo valor p y el intervalo de predicción tiende a ¡i ± z aP ■ cr. Existe 
incertidumbre con respecto a un solo valor X incluso cuando no hay necesidad de estimarlo. 

Intervalos de tolerancia 

Considérese una población de automóviles de cierto tipo y supóngase que en condiciones 
específicas, la eficiencia de combustible (mpg) tiene una distribución normal con p = 30 y 
cr = 2. Entonces como el intervalo de —1.645 a 1.645 captura 90% del área bajo la curva z, 
90% de todos estos automóviles tendrán valores de eficiencia de combustible entre 
/x — 1.645cr = 26.71 y /a, + 1.645cr = 33.29. Pero ¿qué sucederá si los valores de /u y cr no 
son conocidos? Se puede tomar una muestra de tamaño n, determinar las eficiencias de com¬ 
bustible, x y s y formar el intervalo cuyo límite inferior es x — 1.645.y y cuyo límite supe¬ 
rior es x + 1,645,v. Sin embargo, debido a la variabilidad de muestreo en las estimaciones 
de ¡jl y cr, existe una buena probabilidad de que el intervalo resultante incluirá menos de 
90% de los valores de la población. Intuitivamente, para tener a priori una probabilidad 
de 95% del intervalo resultante incluido por lo menos 90% de los valores de la población, 
cuando x y s se utilizan en lugar de p y cr, también se deberá reemplazar 1.645 con un nú¬ 
mero más grande. Por ejemplo, cuando n = 20, el valor 2.310 es tal que se puede estar 95% 
confiado en que el intervalo x ± 2.310.? incluirá por lo menos 90% de los valores de eficien¬ 
cia de combustible en la población. 


Sea k un número entre 0 y 100. Un intervalo de tolerancia para capturar por lo me¬ 
nos el k% de los valores en una distribución de población normal con nivel de con¬ 
fianza de 95% tiene la forma 

x ± (valor crítico de tolerancia) • s 

En la tabla A.6 del apéndice aparecen valores críticos de tolerancia con k = 90, 95 y 
99 en combinación con varios tamaños de muestra. Esta tabla también incluye valo¬ 
res críticos para un nivel de confianza de 99% (estos valores son más grandes que los 
valores correspondientes al 95%). Si se reemplaza ± con + se obtiene un límite de 
tolerancia superior y si se utiliza — en lugar de ± se obtiene un límite de tolerancia 
inferior. En la tabla A.6 también aparecen valores críticos para obtener estos límites 
unilaterales. 


Con n = 10, x = 21.90, í = 4.134 y í 0025 9 = 2.262, un intervalo de predicción de 95% 
para el contenido de grasa de un solo perro caliente es 


21.90 ± (2.262)(4.134) /l + ^ = 21.90 ± 9.81 

= (12.09, 31.71) 
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Ejemplo 7.14 Regresemos a los datos de módulo de elasticidad discutidos en el ejemplo 7.11, donde n = 
16, x = 14532.5, s = 2055.67 y una curva de probabilidad normal de los datos indicaron 
que la normalidad de la población era bastante factible. Con un nivel de confianza de 95%, 
un intervalo de tolerancia bilateral para capturar por lo menos 95% de los valores de módu¬ 
lo de elasticidad de especímenes de madera en la población muestreada utiliza el valor crí¬ 
tico de tolerancia de 2.903. El intervalo resultante es 

14532.5 ± (2.903X2055.67) = 14532.5 ± 5967.6 = (8 564.9, 20500.1) 

Se puede estar totalmente confiado de que por lo menos 95% de todos los especímenes de 
madera tienen valores de módulo de elasticidad entre 8564.9 y 20500.1. 

El intervalo de confianza de 95% para p. fue (13437.3, 15627.7) y el intervalo de pre¬ 
dicción de 95% para el módulo de elasticidad de un solo espécimen de madera es (10017.0, 
19048.0). Tanto el intervalo de predicción como el intervalo de tolerancia son sustancial¬ 
mente más anchos que el intervalo de confianza. ■ 

Intervalos basados en distribuciones 
de población no normales 

El intervalo de confianza t para una muestra de ¡jl es robusto en cuanto a alejamientos pe¬ 
queños o incluso moderados de la normalidad a menos que n sea bastante pequeño. Con esto 
se quiere decir que si se utiliza un valor crítico para confianza de 95%, por ejemplo, al calcular 
el intervalo, el nivel de confianza real se aproximará de manera razonable al nivel nominal de 
95%. Sin embargo, si n es pequeño y la distribución de la población es altamente no normal, 
entonces el nivel de confianza real puede ser diferente en forma considerable del que se utiliza 
cuando se obtiene un valor crítico particular de la tabla t. Ciertamente ¡ sería penoso creer que 
el nivel de confianza es de más o menos 95% cuando en realidad era como de 88%! Se ha 
visto que la técnica bootstrap, introducida en la sección 7.1 es bastante exitosa al estimar 
parámetros en una amplia variedad de situaciones no normales. 

En contraste con el intervalo de confianza, la validez de los intervalos de predicción y 
tolerancia descritos en esta sección están estrechamente vinculados a la suposición de norma¬ 
lidad. Estos últimos intervalos no deberán ser utilizados sin evidencia apremiante de normali¬ 
dad. La excelente referencia Statistical Intervals, citada en la bibliografía al final de este 
capítulo, discute procedimientos alternativos de esta clase en otras situaciones. 



EJERCICIOS Sección 7.3 (28-41) 


28. Determine los valores de las siguientes cantidades: 

a - ^0.1,15 ^0.05,15 C ‘ f 0.05,25 •*. f 0 .05,40 e - *0.005,40 

29. Determine el valor crítico t que capturará el área deseada de 
la curva t en cada uno de los siguientes casos: 

a. Área central = 0.95, gl = 10 

b. Área central = 0.95, gl = 20 

c. Área central = 0.99, gl = 20 

d. Área central = 0.99, gl = 50 

e. Área de cola superior = 0.01, gl = 25 

f. Área de cola inferior = 0.025, gl = 5 

30. Determine el valor t crítico de un intervalo de confianza bi¬ 
lateral en cada una de las siguientes situaciones: 

a. Nivel de confianza = 95%, gl = 10 

b. Nivel de confianza = 95%, gl = 15 

c. Nivel de confianza = 99%, gl = 15 


d. Nivel de confianza = 99%, n = 5 

e. Nivel de confianza = 98%, gl = 24 

f. Nivel de confianza = 99%, n = 38 

31. Determine el valor t crítico para un límite de confianza in¬ 
ferior o superior en cada una de las situaciones descritas en 
el ejercicio 30. 

32. Una muestra aleatoria de n = 18 especímenes de prueba de 
fibra de vidrio E de un tipo dio un esfuerzo de cedencia por 
esfuerzo cortante interfacial medio muestral de 30.2 y una 
desviación estándar muestral de 3.1 (“On Interfacial Failu- 
re in Notched Unidirectional Glass/Epoxy Composites”, J. of 
Composite Materials, 1985: 276-286). Suponiendo que el 
esfuerzo de cedencia por esfuerzo cortante interfacial está 
normalmente distribuido, calcule un intervalo de confian¬ 
za de 95% para el esfuerzo promedio verdadero (como lo 
hicieron los autores del artículo citado). 
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33. El artículo “Measuring and Understanding the Aging of 
Kraft Insulating Paper in Power Transformers” (IEEE Elec- 
trical Insu.1. Mag., 1996: 28-34) contiene las siguientes ob¬ 
servaciones de grado de polimerización de especímenes de 
papel para los cuales la concentración de tiempos de visco- 


sidad 

cayeron en un 

rango 

medio: 



418 

421 

421 

422 

425 

427 

431 

434 

437 

439 

446 

447 

448 

453 

454 

463 

465 






a. Construya una gráfica de caja de los datos y comente so¬ 
bre cualquier característica interesante. 

b. ¿Es factible que las observaciones muéstrales dadas fue¬ 
ron seleccionadas de una distribución normal? 

c. Calcule un intervalo de confianza de 95% bilateral para 
un grado de polimerización promedio verdadero (como 
lo hicieron los autores del artículo). ¿Sugiere este inter¬ 
valo que 440 es un valor factible del grado de polimeri¬ 
zación promedio verdadero? ¿Qué hay en cuanto a 450? 

34. Una muestra de 14 especímenes de junta de un tipo particu¬ 
lar produjo un esfuerzo límite proporcional medio muestral 
de 8.48 MPa y una desviación estándar muestral de 0.79 MPa 
(“Characterization of Bearing Strength Factors in Pegged 
Timber Connections”, J. ofStructuralEn.gr., 1997: 326-332). 

a. Calcule e interprete un límite de confianza inferior de 
95% para el esfuerzo límite proporcional promedio ver¬ 
dadero de todas las juntas. ¿Qué suposiciones hizo sobre 
la distribución del esfuerzo límite proporcional? 

b. Calcule e interprete un límite de predicción inferior de 
95% para el esfuerzo límite proporcional de una sola 
unión de este tipo. 

35. Para corregir deformidades nasales congénitas se utiliza rino- 
plastia de aumento mediante implante de Silicon. El éxito del 
procedimiento depende de varias propiedades biomecánicas 
del periostio y fascia nasales humanas. El artículo “Biome- 
chanics in Augmentation Rhinoplasty” (J. ofMed. Engr. and 
Tech., 2005: 14-17) reportó que para una muestra de 15 adul¬ 
tos (recién fallecidos), la deformación de falla media (en por¬ 
centaje) fue de 25.0 y la desviación estándar fue de 3.5. 

a. Suponiendo una distribución normal de la deformación 
de falla, estime la deformación promedio verdadera en 
una forma que transmita información acerca de preci¬ 
sión y confiabilidad. 

b. Pronostique la deformación para un solo adulto en una 
forma que transmita información sobre precisión y con¬ 
fiabilidad. ¿Cómo se compara la predicción con la esti¬ 
mación calculada en el inciso a)? 

36. Las n = 26 observaciones de tiempo de escape dadas en el 
ejercicio 36 del capítulo 1 dan una media y desviación es¬ 
tándar muéstrales de 370.69 y 24.36, respectivamente. 

a. Calcule un límite de confianza superior para el tiempo 
de escape medio de la población utilizando un nivel de 
confianza de 95 por ciento. 

b. Calcule un límite de predicción superior para el tiempo 
de escape de un solo trabajador adicional utilizando un 
nivel de predicción de 95%. ¿Cómo se compara este lí¬ 
mite con el límite de confianza del inciso a)? 

c. Suponga que se escogerán dos trabajadores más para par¬ 
ticipar en el ejercicio de escape simulado. Denote sus 
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tiempos de escape por X 21 y X 2S y sea 2f nuev0 el promedio 
de estos dos valores. Modifique la fórmula para un inter¬ 
valo de predicción con un solo valor de x para obtener un 
intervalo de predicción para X nllevo y calcule un intervalo 
bilateral de 95% basado en los datos de escape dados. 

37. Un estudio de la capacidad de individuos de caminar en lí¬ 
nea recta (“Can We Really Walk Straight?” Amer. J. ofPhy- 
sical Anthro, 1992: 19-27) reportó los datos adjuntos sobre 
cadencia (pasos por segundo) con una muestra de n = 20 
hombres saludables seleccionados al azar. 

0.95 0.85 0.92 0.95 0.93 0.86 1.00 0.92 0.85 0.81 

0.78 0.93 0.93 1.05 0.93 1.06 1.06 0.96 0.81 0.96 

Un diagrama de probabilidad normal apoya de manera sustan¬ 
cial la suposición de que la distribución de la población de ca¬ 
dencia es aproximadamente normal. A continuación se da un 
resumen descriptivo de los datos obtenidos con MINITAB: 

Variable N Media Mediana MediaTR DesvEstMedianaSE 


Cadencia 20 0.9255 

0.9300 

0.9261 

0.0809 0.0181 

Cadencia 

Mín 

Máx 

Q1 

Q3 

variable 

0.7800 

1.0600 

0.8525 

0.9600 


a. Calcule e interprete un intervalo de confianza de 95% 
para la cadencia media de la población. 

b. Calcule e interprete un intervalo de predicción de 95% 
para la cadencia de un solo individuo seleccionado 
al azar de esta población. 

c. Calcule un intervalo que incluya por lo menos 99% de 
las cadencias incluidas en la distribución de la población 
utilizando un nivel de confianza de 95 por ciento. 

38. Se seleccionó una muestra de 25 piezas de laminado utili¬ 
zado en la fabricación de tarjetas de circuito y se determinó 
la cantidad de pandeo (pulg) en condiciones particulares 
con cada pieza y el resultado fue un pandeo medio muestral 
de 0.0635 y una desviación estándar muestral de 0.0065. 

a. Calcule una predicción de la cantidad de pandeo de una 
sola pieza de laminado de una manera que proporcione 
información sobre precisión y confiabilidad. 

b. Calcule un intervalo con el cual pueda tener un alto gra¬ 
do de confianza de que por lo menos 95% de todas las 
piezas de laminado produzcan cantidades de pandeo que 
estén entre los dos límites del intervalo. 

39. El ejercicio 72 del capítulo 1 dio las siguientes observacio¬ 
nes de afinidad de receptor (volumen de distribución ajus¬ 
tado) con una muestra de 13 individuos sanos: 23, 39, 40, 
41, 43, 47, 51, 58, 63, 66, 67, 69, 72. 

a. ¿Es factible que la distribución de la población de la cual 
se seleccionó esta muestra sea normal? 

b. Calcule un intervalo con el cual pueda estar 95% con¬ 
fiado de que por lo menos 95% de todos los individuos 
saludables en la población tienen volúmenes de distri¬ 
bución ajustados que quedan entre los límites del in¬ 
tervalo. 

c. Pronostique el volumen de distribución ajustado de un 
solo individuo saludable calculando un intervalo de 
predicción de 95%. ¿Cómo se compara el ancho de este 
intervalo con el ancho del intervalo calculado en el in¬ 
ciso b)? 
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40. El ejercicio 13 del capítulo 1 presentó una muestra de n = 
153 observaciones de resistencia última a la tensión y el 
ejercicio 17 de la sección previa dio cantidades resumidas y 
solicitó un intervalo de confianza muestral grande. Como el 
tamaño de muestra es grande, no se requieren suposiciones 
sobre la distribución de la población en cuanto la validez 
del intervalo de confianza. 

a. ¿Se requiere alguna suposición sobre la distribución 
de la resistencia a la tensión antes de calcular un límite de 
predicción inferior para la resistencia a la tensión del 
nuevo espécimen seleccionado por medio del método 
descrito en esta sección? Explique. 

b. Use un paquete de software estadístico para investigar la 
probabilidad de una distribución de población normal. 


c. Calcule un límite de predicción inferior con un nivel de 
predicción de 95% para la resistencia última a la tensión 
del siguiente espécimen seleccionado. 

41. Una tabla más extensa de valores t críticos que la que apa¬ 
rece en este libro muestra que para la distribución t con 20 
grados de libertad, las áreas a la derecha de los valores 
0.687, 0.860 y 1.064 son 0.25, 0.20 y 0.15, respectivamen¬ 
te. ¿Cuál es el nivel de confianza para cada uno de los si¬ 
guientes tres intervalos de confianza para la media ¿i de una 
distribución de población normal? ¿Cuál de los tres interva¬ 
los recomendaría utilizar y por qué? 

a. (je - 0.687í/V2l, x + 1.725.s/V2l) 

b. (x — O.86O5/V2T, ic + 1.325í/V21) 

c. (x - 1.064.S/V2T, x + 1.064sV\/2T) 



7.4 Intervalos de confianza para la varianza 

y desviación estándar de una población normal 


Aun cuando las inferencias por lo que se refiere a la varianza cr 2 o a la desviación estándar 
de una población en general son de menos interés que aquellas con respecto a una media o 
proporción, hay ocasiones en que se requieren tales procedimientos. En el caso de una dis¬ 
tribución de población normal, las inferencias están basadas en el siguiente resultado por lo 
que se refiere a la varianza muestral S 2 . 


TEOREMA 


Sean X v X 2 ,. . ., X n una muestra aleatoria de una distribución normal con parámetros 
p, y cr 2 . Entonces la variable aleatoria 

(n - 1)S 2 = Z(X, - X) 2 
(T 2 cr 2 

tiene una distribución de probabilidad ji cuadrada (y 2 ) con n — 1 grados de libertad. 


O 


Como se discutió en las secciones 4.4 y 7.1, la distribución ji cuadrada es una distri¬ 
bución de probabilidad continua con un solo parámetro v, llamado número de grados de li¬ 
bertad, con posibles valores de 1, 2, 3, . . . Las gráficas de varias funciones de distribución 
de probabilidad se ilustran en la figura 7.9. Cada función de distribución de probabilidad 
/(;c; v) es positiva sólo con x > 0 y cada una tiene asimetría positiva (una larga cola supe¬ 
rior), aunque la distribución se mueve hacia la derecha y se vuelve más simétrica a medida 
que se incrementa v. Para especificar procedimientos inferenciales que utilizan la distribu¬ 
ción ji cuadrada, se requiere una notación análoga a aquella para un valor t crítico t a v . 



Figura 7.9 Gráficas de funciones de densidad ji cuadrada. 
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Notación 

Sea v > I ltimíiclo valor crítico ji cuadrada, el número sobre el eje de medición de 
modo que a del área bajo la curva ji cuadrada con v grados de libertad quede a la 
derecha de y 2 . 

a,v 



La simetría de las distribuciones t hizo que fuera necesario tabular sólo valores críti¬ 
cos t de cola superior (t a v con valores pequeños de a). La distribución ji cuadrada no es si¬ 
métrica, por lo que la tabla A.7 del apéndice contiene valores de x 2 tanto para a cerca de 
0 como cerca de 1, como se ilustra en la figura 7.10b). Por ejemplo, A'oozs w = 26.119 y 
xl 95 20 (el 5 o percentil) = 10.851. 


X 2 función de distribución 
de probabilidad 

Área sombreada = a 



í 

y 2 

Ací'V 


a) 


Cada área 
sombreada = 0.01 



í í 

2 2 

4'o.99,i' 4 'o.01,J' 


b) 


Figura 7.10 Notación xl v ilustrada. 


La variable aleatoria (n — 1 )S 2 /cr 2 satisface los dos parámetros en los cuales está ba¬ 
sado el método general de obtener un intervalo de confianza. Es una función del parámetro 
de interés cr 2 , no obstante su distribución de probabilidad (ji cuadrada) no depende de este 
parámetro. El área bajo una curva ji cuadrada con v grados de libertad a la derecha de x 2 a n v 
es a/2, lo mismo que a la izquierda de x\- a n v este modo el área capturada entre estos 
dos valores críticos es 1 — a. Como una consecuencia de esto y el teorema que se acaba de 
formular, 

p[x 2 < — ~ < x 2 'l = 1 - a (7 17) 

l'M—a/2,n—1 ^2 *a/2,n-ll 

Las desigualdades en (7.17) equivalen a 

(»- ns 2 < ^2 < (« - OS 2 

2 2 

2(al2,n— 1 L ] - al2_,n - I 

Sustituyendo el valor calculado s 2 en los límites se obtiene un intervalo de confianza para 
cr 2 y tomando las raíces cuadradas se obtiene un intervalo para cr. 



Un intervalo de confianza de 100(1 — a)% para la varianza a 2 de una población 
normal tiene un límite inferior 


y límite superior 


(n - 1 )s 2 /x 2 al2j 


1 


(n - 1 )s 2 /X 2 l - a/1¡n - 1 

Un intervalo de confianza para a tiene límites superior e inferior que son las raíces 
cuadradas de los límites correspondientes en el intervalo para cr 2 . 




























c7_p225-283.qxd 3/12/08 4:15 AM Page 280 



280 CAPÍTULO 7 Intervalos estadísticos basados en una sola muestra 

Ejemplo 7.15 Los datos adjuntos sobre voltaje de ruptura de circuitos eléctricamente sobrecargados se to¬ 
maron de un diagrama de probabilidad normal que apareció en el artículo “Damage of Fle¬ 
xible Printed Wiring Boards Associated with Lightning-Induced Voltage Surges”, (IEEE 
Transactions on Components, Hybrids, andMcinuf. Tech., 1985: 214-220). La linealidad del 
diagrama apoyó de manera firme la suposición de que el voltaje de ruptura está aproxima¬ 
damente distribuido en forma normal. 

1470 1510 1690 1740 1900 2000 2030 2100 2190 

2200 2290 2380 2390 2480 2500 2580 2700 

Sea a 2 la varianza de la distribución del voltaje de ruptura. El valor calculado de la varian- 

za muestral es s 2 = 137 324.3, la estimación puntual de cr 2 . Con grados de libertad = n — 

1 = 16, un intervalo de confianza de 95% requiere X^gj ¡ 16 = 6.908 y ^oo^s 16 = 28.845. El 
intervalo es 


Tomando la raíz cuadrada de cada punto extremo se obtiene (276.0, 564.0) como el intervalo 
de confianza de 95% para cr. Estos intervalos son bastante anchos, lo que refleja la variabilidad 
sustancial del voltaje de ruptura en combinación con un tamaño de muestra pequeño. ■ 

Los intervalos de confianza para cr 2 y cr cuando la distribución de la población no es 
normal pueden ser difíciles de obtener, incluso cuando el tamaño de muestra es grande. En 
esos casos, consulte a un estadístico conocedor. 




O 


EJERCICIOS Sección 7.4 (42-46) 


42. Determine los valores de las siguientes cantidades: 

Xo.1,15 b. Ao.1,25 

C " Aío.01,25 *L ito.005,25 

e ' Lo.99,25 L Lo.995,25 

43. Determine lo siguiente: 

a. El 95° percentil de la distribución ji cuadrada con 
v = 10. 

b. El 5° percentil de la distribución ji cuadrada con 
v = 10. 

c. P(10.98 < x 2 — 36.78), donde x 2 es una variable alea¬ 
toria ji cuadrada con v = 22. 

d. P(x 2 < 14.61 loy 2 > 37.652), donde x 2 es una variable 
aleatoria ji cuadrada con v = 25. 

44. Se determinó la cantidad de expansión lateral (mils) con 
una muestra de n = 9 soldaduras de arco de gas metálico de 
energía pulsante utilizadas en tanques de almacenamiento 
de buques LNG. La desviación estándar muestral resultan¬ 
te fue ,v = 2.81 mils. Suponiendo normalidad, obtenga un 
intervalo de confianza de 95% para <x 2 y para cr. 


45. Se hicieron las siguientes observaciones de tenacidad a la 
fractura de una placa base de acero maraging con 18% de 
níquel ["Fracture Testing of Weldments”, ASTM Special 


Publ. No. 381, 1965: 328-356 (en k/pulg Vpulg., dadas en 
orden creciente)]: 


69.5 

71.9 

72.6 

73.1 

73.3 

73.5 

75.5 

75.7 

75.8 

76.1 

76.2 

76.2 

77.0 

77.9 

78.1 

79.6 

79.7 

79.9 

80.1 

82.2 

83.7 

93.7 




Calcule un intervalo de confianza de 99% para la desvia¬ 
ción estándar de la distribución de la tenacidad a la fractu¬ 
ra. ¿Es válido este intervalo cualquiera que sea la naturaleza 
de la distribución? Explique. 

46. Los resultados de una prueba de turbiedad de Wagner reali¬ 
zada con 15 muestras de arena de prueba Ottawa estándar 
(en microamperes) 

26.7 25.8 24.0 24.9 26.4 25.9 24.4 21.7 

24.1 25.9 27.3 26.9 27.3 24.8 23.6 

a. ¿Es factible que esta muestra fuera seleccionada de una 
distribución de población normal? 

b. Calcule un límite de confianza superior con nivel de 
confianza de 95% para la desviación estándar de turbiedad 
de la población. 
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EJERCICIOS SUPLEMENTARIOS (47-62) 


47. El ejemplo 1.10 introdujo las observaciones adjuntas sobre 
fuerza de adhesión. 


11.5 

12.1 

9.9 

9.3 

7.8 

6.2 

6.6 

7.0 

13.4 

17.1 

9.3 

5.6 

5.7 

5.4 

5.2 

5.1 

4.9 

10.7 

15.2 

8.5 

4.2 

4.0 

3.9 

3.8 

3.6 

3.4 

20.6 

25.5 

13.8 

12.6 

13.1 

8.9 

8.2 

10.7 

14.2 

7.6 

5.2 

5.5 

5.1 

5.0 

5.2 

4.8 

4.1 

3.8 

3.7 

3.6 

3.6 

3.6 


a. Calcule la fuerza de adhesión promedio verdadera de 
una manera que dé información sobre precisión y con¬ 
fiabilidad. [Sugerencia'. Y.x¡ = 387.8 y = 4247.08.] 

b. Calcule un intervalo de confianza de 95% para la pro¬ 
porción de todas las adhesiones cuyos valores de fuerza 
excederían de 10. 

48. Un triatlón incluye natación, ciclismo y carrera a pie y es 
uno de los eventos deportivos amateurs más extenuantes. 
El artículo “Cardiovascular and Thermal Response of 
Triathlón Performance” (Medicine and Science in Sports 
and Exercise, 1988: 385-389) reporta sobre un estudio de 
investigación de nueve triatletas varones. Se registró el rit¬ 
mo cardiaco máximo (pulsaciones/min) durante la actua¬ 
ción de cada uno de los tres eventos. Para natación, la media 
y la desviación estándar muéstrales fueron 188.0 y 7.2, 
respectivamente. Suponiendo que la distribución de ritmo 
cardiaco es (de manera aproximada) normal, construya un 
intervalo de confianza de 98% para el ritmo cardiaco medio 
verdadero de triatletas mientras nadan. 

49. Para cada uno de los 18 núcleos de depósitos de carbonato 
humedecidos con aceite, la cantidad de saturación de gas re¬ 
sidual después de la inyección de un solvente se midió en la 
corriente de agua de salida. Las observaciones, en porcen¬ 
taje de volumen de poros, fueron 


23.5 

31.5 

34.0 

46.7 

45.6 

32.5 

41.4 

37.2 

42.5 

46.9 

51.5 

36.4 

44.5 

35.7 

33.5 

39.3 

22.0 

51.2 


(Véase “Relative Permeability Studies of Gas-Water Flow 
Following Solvent Injection in Carbonate Rocks”, Soc. Pe¬ 
troleum Engineers J '., 1976: 23-30.) 

a. Construya una gráfica de caja de estos datos y comente 
sobre cualquier característica interesante. 

b. ¿Es factible que la muestra fuera seleccionada de una 
distribución de población normal? 

c. Calcule un intervalo de confianza de 98% para la canti¬ 
dad promedio verdadera de saturación de gas residual. 

50. Un artículo publicado en un periódico reporta que se utilizó 
una muestra de tamaño 5 como base para calcular un inter¬ 
valo de confianza de 95% para la frecuencia natural (Hz) 
promedio verdadera de vigas deslaminadas de cierto tipo. 
El intervalo resultante fue (229.764, 233.504). Usted decide 
que un nivel de confianza de 99% es más apropiado que el 
de 95% utilizado. ¿Cuáles son los límites del intervalo de 
99% [ Sugerencia : Use el centro del intervalo y su ancho 
para determinar x y i.] 


51. El gerente financiero de una gran cadena de tiendas depar¬ 
tamentales seleccionó una muestra aleatoria de 200 de sus 
clientes que pagan con tarjeta de crédito y encontró que 136 
habían incurrido en pago de intereses durante el año previo 
a causa de saldos vencidos. 

a. Calcule un intervalo de confianza de 90% para la pro¬ 
porción verdadera de clientes de tarjeta de crédito que 
incurrieron en pago de intereses durante el año previo. 

b. Si el ancho deseado del intervalo de 90% es de 0.05, ¿qué 
tamaño de muestra se requiere para garantizar esto? 

c. ¿Especifica el límite superior del intervalo del inciso a) 
un límite de confianza superior de 90% para la propor¬ 
ción que se está estimando? Explique. 

52. La alta concentración del elemento tóxico arsénico es de¬ 
masiado común en el agua subterránea. El artículo “Evalua- 
tion of Treatment Systems for the Removal of Arsenic from 
Groundwater” (Practice Periodical of Hazardous, Toxic, 
and Radioactive Waste Magmt., 2005: 152-157) reportó que 
para una muestra de n — 5 especímenes de agua seleccio¬ 
nada para tratamiento por coagulación, la concentración de 
arsénico media muestral fue de 24.3 p.g/1, y la desviación 
estándar muestral fue de 4.1. Los autores del artículo citado 
utilizaron métodos basados en t para analizar sus datos, así 
que venturosamente tuvieron razón al creer que la distribu¬ 
ción de concentración de arsénico era normal. 

a. Calcule e interprete un intervalo de confianza de 95% 
para concentración de arsénico verdadera en todos los 
especímenes de agua. 

b. Calcule un límite de confianza superior de 90% para la 
desviación estándar de la distribución de la concentra¬ 
ción de arsénico. 

c. Pronostique la concentración de arsénico de un solo es¬ 
pécimen de agua de modo que dé información sobre pre¬ 
cisión y confiabilidad. 

53. La infestación con pulgones de árboles frutales puede ser 
controlada rociando un pesticida o mediante la inundación 
con mariquitas. En un área particular, se seleccionan cuatro 
diferentes arboledas de árboles frutales para experimenta¬ 
ción. Las primeras tres arboledas se rocían con los pestici¬ 
das 1, 2 y 3, respectivamente y la cuarta se trata con 
mariquitas con los siguientes resultados de cosecha: 


Tratamiento 

n i = 

Número de 
árboles 

x ¡ 

(Medida de 
áridos/árbol) 

s¡ 

1 

100 

10.5 

1.5 

2 

90 

10.0 

1.3 

3 

100 

10.1 

1.8 

4 

120 

10.7 

1.6 


Sea ¿i, = la cosecha promedio verdadera (medida de áridos/ 
árbol) después de recibir el í-ésimo tratamiento. En ese caso 

0 = yOi + P-2 + P- 3 ) “ P4 

mide la diferencia de las cosechas promedio verdaderas entre 
el tratamiento con pesticidas y el tratamiento con mariquitas. 
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Cuando n t , n 2 y n¡ son grandes, el estimador 9 obtenido al 
reemplazar cada ¡x¡ con X¡ es aproximadamente normal. Use 
esto para obtener un intervalo de confianza muestral grande 
de 100(1 — a)% y calcule el intervalo de 95% con los da¬ 
tos dados. 

54. Es importante que las máscaras utilizadas por bomberos 
sean capaces de soportar altas temperaturas porque los 
bomberos comúnmente trabajan en temperaturas de 200- 
500°F. En una prueba de un tipo de máscara, a 11 de 55 
máscaras se les desprendió la mica a 250°. Construya un in¬ 
tervalo de confianza de 90% para la proporción de másca¬ 
ras verdadera de este tipo cuya mica se desprendería a 250°. 

55. Un fabricante de libros de texto universitarios está interesado 
en investigar la resistencia de las encuadernaciones produ¬ 
cidas por máquina de encuadernar particular. La resistencia 
puede ser medida registrando la fuerza requerida para 
arrancar las páginas de la encuademación. Si esta fuerza se 
mide en libras, ¿cuántos libros deberán ser probados para 
calcular la fuerza promedio requerida para romper la encua¬ 
dernación dentro de 0.1 Ib con 95% de confianza? Suponga 
que se sabe que cr es de 0.8. 

56. Es bien sabido que la exposición a la fibra de asbesto es un 
riesgo para la salud. El artículo “The Acute Effects of Chry- 
sotile Asbestos Exposure on Lung Function” ( Environ. Re¬ 
search, 1978: 360-372) reporta resultados sobre un estudio 
basado en una muestra de trabajadores de la construcción 
que habían estado expuestos a asbesto durante un periodo 
prolongado. Entre los datos dados en el artículo se encon¬ 
traron los siguientes valores (ordenados) de elasticidad pul¬ 
monar (cm 3 /cm H,0) por cada uno de los 16 sujetos 8 
meses después del periodo de exposición (la elasticidad 
pulmonar mide la elasticidad de los pulmones o cuán efec¬ 
tivamente los pulmones son capaces de inhalar y exhalar): 


167.9 

180.8 

184.8 

189.8 

194.8 

200.2 

201.9 

206.9 

207.2 

208.4 

226.3 

227.7 

228.5 

232.4 

239.8 

258.6 




a. ¿Es factible que la distribución de la población sea normal? 

b. Calcule un intervalo de confianza de 95% para la elasticidad 
pulmonar promedio verdadera después de la exposición. 

c. Calcule un intervalo que, con un nivel de confianza de 
95%, incluya por lo menos 95% de los valores de elasti¬ 
cidad pulmonar en la distribución de la población. 

57. En el ejemplo 6.8, se introdujo el concepto de experimento 
censurado en el cual n componentes se prueban y el experi¬ 
mento termina en cuanto r de los componentes fallan. Su¬ 
ponga que las vidas útiles de los componentes son 
independientes, cada uno con distribución exponencial y 
parámetro A. Sea Y l el tiempo en el cual ocurre la primera 
falla, Y 2 el tiempo en el cual ocurre la segunda falla, y así 
sucesivamente, de modo que T r = T¡ + • ■ ■ + Y r + (n — r) 
Y r , es la vida útil total acumulada. En ese caso se puede de¬ 
mostrar que 2A7j., tiene una distribución ji cuadrada con 2 r 
grados de libertad. Use esto para desarrollar una fórmula 
para un intervalo de confianza de 100(1 — a)% para una vi¬ 
da útil promedio verdadera 1/A. Calcule un intervalo de 
confianza de 95% con los datos del ejemplo 6.8. 


58. 


Sean X 3 , X-,, . . . , X n una muestra aleatoria de una distribu¬ 
ción de probabilidad continua con mediana jl (de modo que 
P(X¡ <¡í) = P(X¡ >¡1) = 0.5). 

a. Demuestre que 


P{ mín(7Q <fü< máx(.>Q) = 1 — 



de modo que máx(jc ¿ )) es un intervalo de confian¬ 

za de 100(1 — a)% para ¡1 con a = |jj" *. [ Sugerencia : 
El complemento del evento {mín(2Q < ¡i < máxlA?)} es 
{máx(A') < /X} U {mín(2Q > ¡í}. Pero máx(Z¡) < pL si y 
sólo si X¡ S ¡i con todas las i.] 

b. Para cada uno de seis infantes normales varones, se de¬ 
terminó la cantidad de alanina aminoácida (mg/100 mi) 
mientras que los infantes llevaban un dieta libre de iso- 
leucina y se obtuvieron los siguientes resultados 


2.84 3.54 2.80 1.44 2.94 2.70 


Calcule un intervalo de confianza de 97% para cantidad 
mediana verdadera de alanina para infantes que llevaban 
esa dieta (“The Essential Amino-Acid Requirements of 
Infants”, Amer. J. Nutrition, 1964: 322-330). 

c. Sean x (2) la segunda más pequeña de las x¡ y la se¬ 
gunda más grande de las x¡. ¿Cuál es el coeficiente de 
confianza del intervalo (jc ( 2) , *(„-i)) para/I? 

59. Sean Aj, X 2 , . . . , X n una muestra aleatoria de una distribu¬ 
ción uniforme en el intervalo [0, 9], de modo que 


/W 


- O<x<0 
9 

0 de lo contrario 


Entonces si Y = máx(X¡), se puede demostrar que la varia¬ 
ble aleatoria U = Y/9 tiene una función de densidad 


_ í nu " _1 0 < u < 1 

fui 11 * | Q de lo contrario 

a. Use f v {u) para verificar que 

p{ [ /a/2) Vn < j < (1 - a/2) l,n j = 1 -a 

y use ésta para derivar un intervalo de confianza de 
100(1 — a)% para 9. 

b. Verifique que P(a y " £ Y 19 £ 1) = 1 — a y obtenga un 
intervalo de confianza de 100(1 — a)% para 9 basado en 
esta proposición de probabilidad. 

c. ¿Cuál de los dos intervalos derivados previamente es más 
corto? Si mi tiempo de espera en la mañana de un camión 
está uniformemente distribuido y los tiempos de espera 
observados son x¡ = 4.2, jc 2 = 3.5, x 3 = 1.7, jc 4 = 1.2 y 
x¡ = 2.4 derive un intervalo de confianza de 95% para 9 
utilizando el más corto de los dos intervalos. 

60. Sea 0 £ y £ a. Entonces un intervalo de confianza de 
100(1 — a)% para ¿i cuando n es grande es 

La opción de y = al2 da el intervalo usual derivado en la 
sección 7.2; si -y A al 2, este intervalo no es simétrico con 
respecto a x. El ancho de este intervalo es w = í(z y + 
z a _ T )/Vñ. Demuestre que w se reduce al mínimo con la op- 
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ción y = a/2, de modo que el intervalo simétrico sea el más 
corto. [ Sugerencia: a) Por definición de z a , <l>(z a ) = 1 — a, 
de modo que z a = O -1 ! 1 — a)\ b) la relación entre la deri¬ 
vada de una función y = fíx) y la función inversa* = /" *(y) 
es (,dldy)f~Hy) = 1 //'«.] 

61. Suponga que x v x 2 ,... ,x n son valores observados resultan¬ 
tes de una muestra aleatoria tomada de una distribución si¬ 
métrica pero posiblemente de cola gruesa. Sean x y f s 
la mediana muestral y la dispersión de los cuartos, respec¬ 
tivamente. El capítulo 11 de Understanding Robust and 
Exploratory Data Analysis (véase la bibliografía del capítu¬ 
lo 6) sugiere el siguiente intervalo de confianza de 95% 
robusto para la media de la población (punto de simetría): 

valor crítico t conservador \ ./' 

1.075 J'Vn 
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El valor de la cantidad entre paréntesis es 2.10 con n — 10, 
1.94 con n = 20 y 1.91 con n = 30. Calcule este intervalo 
de confianza con los datos del ejercicio 45 y compare con 
el intervalo de confianza t apropiado para distribución de 
población normal. 

62. a. Use los resultados del ejemplo 7.5 para obtener un lími¬ 
te de confianza inferior de 95% para el parámetro A de 
una distribución exponencial y calcule el límite basado 
en los datos dados en el ejemplo, 
b. Si la vida útil tiene una distribución exponencial, la pro¬ 
babilidad de que la vida útil exceda de t es P(X > t) = 
e~ Xt . Use el resultado del inciso a) para obtener un lími¬ 
te de confianza inferior de 95% para la probabilidad de 
que el tiempo de ruptura exceda de 100 min. 


intervalos estadísticos (de confianza, predicción, tolerancia 
y otros). 

Larsen, Richard y Morris Marx, Introduction to Mathematical 
Statistics'. (2a. ed.), Prentice Hall, Englewood, Cliffs, NJ.. 
1986. Similar a la presentación de DeGroot, pero un poco me¬ 
nos matemática. 
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8 Pruebas de hipótesis 
basadas en una sola 
muestra 


INTRODUCCIÓN 

Un parámetro puede ser estimado a partir de datos muéstrales o con un solo núme¬ 
ro (una estimación puntual) o un intervalo completo de valores plausibles (un inter¬ 
valo de confianza). Con frecuencia, sin embargo, el objetivo de una investigación no 
es estimar un parámetro sino decidir cuál de dos pretensiones contradictorias sobre 
el parámetro es la correcta. Los métodos para lograr esto comprenden la parte de la 
inferencia estadística llamada prueba de hipótesis. En este capítulo, primero se dis¬ 
cuten algunos de los conceptos y terminología básicos en la prueba de hipótesis y 
luego se desarrollan procedimientos para la toma de decisiones para los problemas 
de realización de pruebas más frecuentemente encontrados con base en una mues¬ 
tra tomada de una sola población. 
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8.1 Hipótesis y procedimientos de prueba 


Una hipótesis estadística o simplemente hipótesis es una pretensión o aseveración sobre el 
valor de un solo parámetro (característica de una población o característica de una distri¬ 
bución de probabilidad), sobre los valores de varios parámetros o sobre la forma de una 
distribución de probabilidad completa. Un ejemplo de una hipótesis es la pretensión de que 
p = 0.75, donde p es el diámetro interno promedio verdadero de un cierto tipo de tubo de 
PVC. Otro ejemplo es la proposición p < 0.10, donde p es la proporción de tarjetas de cir¬ 
cuito defectuosas entre todas las tarjetas de circuito producidas por un cierto fabricante. Si 
p í y p n denotan las resistencias a la ruptura promedio verdaderas de dos tipos diferentes de 
cuerdas, una hipótesis es la aseveración de que p l — p 2 = 0 y otra es que p i ~ p 2 > 5. No 
obstante otro ejemplo de una hipótesis es la aseveración de que la distancia de detención en 
condiciones particulares tiene una distribución normal. Hipótesis de esta última clase se 
considerarán en el capítulo 14. En éste y en los siguientes capítulos, la atención se concen¬ 
tra en hipótesis en relación con parámetros. 

En cualquier problema de prueba de hipótesis, existen dos hipótesis contradictorias 
consideradas. Una podría ser la pretensión de que p = 0.75 y la otra p A 0.75 o las dos pro¬ 
posiciones contradictorias podrían ser p > 0.10 y p < 0.10. El objetivo es decidir, con ba¬ 
se en información muestral, cuál de las dos hipótesis es la correcta. Existe una analogía 
conocida de esto en un juicio criminal. Una pretensión es la aseveración de que el individuo 
acusado es inocente. En el sistema judicial estadounidense, esta es la pretensión que inicial¬ 
mente se cree que es cierta. Sólo de cara a una fuerte evidencia que diga lo contrario el ju¬ 
rado deberá rechazar esta pretensión a favor de la aseveración alternativa de que el acusado 
es culpable. En este sentido, la pretensión de inocencia es la hipótesis favorecida o protegi¬ 
da y el agobio de comprobación recae en aquellos que creen en la pretensión alternativa. 

Asimismo, al probar hipótesis estadísticas, el problema se formulará de modo que una 
de las pretensiones sea inicialmente favorecida. Esta pretensión inicialmente favorecida no 
será rechazada a favor de la pretensión alternativa a menos que la evidencia muestral la con¬ 
tradiga y apoye fuertemente la aseveración alternativa. 


DEFINICIÓN 


La hipótesis nula denotada por H 0 , es la pretensión de que inicialmente se supone 
cierta (la pretensión de “creencia previa”). La hipótesis alternativa denotada por H ñ , 
es la aseveración contradictoria a H 0 . 

La hipótesis nula será rechazada en favor de la hipótesis alternativa sólo si la 
evidencia muestral sugiere que H 0 es falsa. Si la muestra no contradice fuertemen¬ 
te a H 0 , se continuará creyendo en la verdad de la hipótesis nula. Las dos posibles 
conclusiones derivadas de un análisis de prueba de hipótesis son entonces rechazar 
H 0 o no rechazar H 0 . 


Una prueba de hipótesis es un método de utilizar datos muéstrales para decidir si la hipó¬ 
tesis nula debe ser rechazada. Por consiguiente se podría probar H 0 : p = 0.75 contra la // a 
alternativa: p =h 0.75. Sólo si los datos muéstrales sugieren fuertemente que p es otra dife¬ 
rente de 0.75 deberá ser rechazada la hipótesis nula. Sin semejante evidencia, H 0 no deberá 
ser rechazada, puesto que sigue siendo bastante plausible. 

En ocasiones un investigador no desea aceptar una aseveración particular a menos y 
hasta que los datos apoyan fuertemente la aseveración. Como ejemplo, supóngase que una 
compañía está considerando aplicar un nuevo tipo de recubrimiento en los cojinetes que fa¬ 
brica. Se sabe que la vida de desgaste promedio verdadera con el recubrimiento actual es de 
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1000 horas. Si p, denota la vida promedio verdadera del nuevo recubrimiento, la compañía 
no desea cambiar a menos que la evidencia sugiera fuertemente que ¡i excede de 1000. Una 
formulación apropiada del problema implicaría probar H 0 : ¡i = 1000 contra // a : ¡jl > 1000. 
La conclusión de que se justifica un cambio está identificada con H d y se requeriría eviden¬ 
cia conclusiva para justificar el rechazo de H 0 y cambiar al nuevo recubrimiento. 

La investigación científica a menudo implica tratar de decidir si una teoría actual de¬ 
be ser reemplazada por una explicación más plausible y satisfactoria del fenómeno investi¬ 
gado. Un método conservador es identificar la teoría actual con H 0 y la explicación 
alternativa del investigador con H, d . El rechazo de la teoría actual ocurrirá entonces sólo 
cuando la evidencia es mucho más compatible con la nueva teoría. En muchas situaciones, 
H d se conoce como “hipótesis del investigador”, puesto que es la pretensión que al investi¬ 
gador en realidad le gustaría validar. La palabra nulo significa “sin ningún valor, efecto o 
consecuencia”, la que sugiere que H 0 no deberá ser identificada con la hipótesis de ningún 
cambio (de la opinión actual), ninguna diferencia, ninguna mejora, y así sucesivamente. Su¬ 
póngase, por ejemplo, que 10% de todas las tarjetas de circuito producidas por un cierto fa¬ 
bricante durante un periodo reciente estaban defectuosas. Un ingeniero ha sugerido un 
cambio del proceso de producción en la creencia de que dará por resultado una proporción 
reducida de tarjetas defectuosas. Sea p la proporción verdadera de tarjetas defectuosas 
que resultan del proceso cambiado. Entonces la hipótesis de investigación en la cual recae 
el agobio de comprobación, es la aseveración de que p < 0.10. Por consiguiente la hipóte¬ 
sis alternativa es H d . p < 0.10. 

En el tratamiento de la prueba de hipótesis, H 0 siempre será formulada como una afir¬ 
mación de igualdad. Si 9 denota el parámetro de interés, la hipótesis nula tendrá la forma 
H 0 : 9 = 9 0 donde 9 0 es un número específico llamado valor nulo del parámetro (valor pre¬ 
tendido para 9 por la hipótesis nula). Como ejemplo, considérese la situación de la tarjeta 
de circuito que se acaba de discutir. La hipótesis alternativa sugerida fue H d . p < 0.10, la 
pretensión de que la modificación del proceso redujo la proporción de tarjetas defectuosas. 
Una opción natural de H 0 en esta situación es la pretensión de que p > 0.10 de acuerdo a la 
cual el nuevo proceso no es mejor o peor que el actualmente utilizado. En su lugar se con¬ 
siderará H 0 : p = 0.10 contra H d . p < 0.10. El razonamiento para utilizar esta hipótesis nu¬ 
la simplificada es que cualquier procedimiento de decisión razonable para decidir entre H 0 : 
/? = 0.10 y H, d . p < 0.10 también será razonable para decidir entre la pretensión de que/7 & 
0.10 y H d . Se prefiere utilizar una H 0 simplificada porque tiene ciertos beneficios técnicos, 
los que en breve serán aparentes. 

La alternativa de la hipótesis nula H 0 : 9 = 9 0 se verá como una de las siguientes tres 
aseveraciones: 1) H d . 9 > 9 0 (en cuyo caso la hipótesis nula implícita es 0 < 9 0 ), 2) //,/ 9 < 
9 0 (por consiguiente la hipótesis implícita nula establece que 9 > 0 {] ) o 3) H d . 9 9 0 . Por 

ejemplo, sea cr la desviación estándar de la distribución de diámetros internos (pulgadas) de 
un cierto tipo de manguito de metal. Si se decidió utilizar el manguito a menos que la evi¬ 
dencia muestral demuestre conclusivamente que cr > 0.001, la hipótesis apropiada sería H 0 : 
cr = 0.001 contra H, d . a > 0.001. El número 0 O que aparece tanto en H 0 como en H d (sepa¬ 
ra la alternativa de la nula) se llama valor nulo. 

Procedimientos de prueba 

Un procedimiento de prueba es una regla, basada en datos muéstrales, para decidir si re¬ 
chazar H 0 . Una prueba de H 0 : p = 0.10 contra H d . p < 0.10 en el problema de tarjetas de 
circuito podría estar basado en examinar una muestra aleatoria de n = 200 tarjetas. Sea X 
el número de tarjetas defectuosas en la muestra, una variable aleatoria binomial; x repre¬ 
senta el valor observado de X, Si H 0 es verdadera, E(X) = np = 200(0.10) = 20, en tanto 
que se pueden esperar menos de 20 tarjetas defectuosas si H d es verdadera. Un valor de x 
un poco por debajo de 20 no contradice fuertemente a H 0 , así que es razonable rechazar H 0 
sólo si x es sustancialmente menor que 20. Un procedimiento de prueba como ése es 
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rechazar H 0 si x < 15 y no rechazarla de lo contrario. Este procedimiento consta de dos 
constituyentes: 1) un estadístico de prueba o función de los datos muéstrales utilizados pa¬ 
ra tomar la decisión y 2) una región de rechazo compuesta de aquellos valores x con los 
cuales H 0 será rechazada a favor de /7 a . De acuerdo a la regla que se acaba de sugerir, la 
región de rechazo se compone de x = 0, 1, 2, . . . , y 15, H 0 no será rechazada si x = 16, 
17, , 199 o 200. 


Un procedimiento de prueba se especifica como sigue: 

1. Un estadístico de prueba, una función de los datos muéstrales en los cuales ha de 
basarse la decisión (rechazar H 0 o no rechazar H 0 ) 

2. Una región de rechazo, el conjunto de todos los valores estadísticos de prueba por 
los cuales H 0 será rechazada. 

La hipótesis nula será rechazada entonces si y sólo si el valor estadístico de prueba 
observado o calculado queda en la región de rechazo. 



Como otro ejemplo, supóngase que una compañía tabacalera afirma que el contenido 
de nicotina prometido /i de los cigarrillos marca B es (cuando mucho) de 1.5 mg. Sería im¬ 
prudente rechazar la afirmación del fabricante sin una fuerte evidencia contradictoria, así 
que una formulación del problema apropiada es probar H 0 : /r = 1.5 con H¿. ¡i > 1.5. Con¬ 
sidérese una regla de decisión basada en analizar una muestra aleatoria de 32 cigarrillos. Sea 
X el contenido de nicotina promedio muestral. Si H 0 es verdadera E(X) = p = 1.5, en tanto 
que si H 0 es falsa, se espera que X exceda de 1.5. Una fuerte evidencia contra H 0 es propor¬ 
cionada por un valor de x que exceda considerablemente de 1.5. Por consiguiente se podría 
utilizar X como un estadístico de prueba junto con la región de rechazo x > 1.6. 

Tanto en el ejemplo de tarjetas de circuito como en el de contenido de nicotina, la se¬ 
lección del estadístico de prueba y la forma de la región de rechazo tienen sentido intuitiva¬ 
mente. Sin embargo, la selección del valor de corte utilizado para especificar la región de 
rechazo es un tanto arbitraria. En lugar de rechazar H 0 : p = 0.10 a favor de H. d : p < 0.10 
cuando x < 15, se podría utilizar la región de rechazo x < 14. En esta región, H 0 no sería 
rechazada si se observaran 15 tarjetas defectuosas, mientras que esta ocurrencia conduciría 
al rechazo de H 0 si se emplea la región inicialmente sugerida. Asimismo, se podría utilizar 
la región de rechazo x > 1.55 en el problema de contenido de nicotina en lugar de la región 
1.60. 

Errores en la prueba de hipótesis 

La base para elegir una región de rechazo particular radica en la consideración de los erro¬ 
res que se podrían presentar al sacar una conclusión. Considérese la región de rechazo 
r < 15 en el problema de tarjetas de circuito. Aun cuando H 0 : p = 0.10 sea verdadera, 
podría suceder que una muestra inusual dé por resultado x = 13, de modo que H 0 sea erró¬ 
neamente rechazada. Por otra parte, aun cuando // a : p < 0.10 sea verdadera, una muestra 
inusual podría dar x = 20, en cuyo caso H 0 no sería rechazada, de nueva cuenta una con¬ 
clusión incorrecta. Por lo tanto es posible que H 0 pueda ser rechazada cuando sea verda¬ 
dera o que H 0 no pueda ser rechazada cuando sea falsa. Estos posibles errores no son 
consecuencia de una región de rechazo tontamente seleccionada. Cualquiera de estos dos 
errores podría presentarse cuando se emplea la región x < 14, o cuando se utiliza cual¬ 
quier otra región. 
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DEFINICIÓN 


Un error de tipo I consiste en rechazar la hipótesis nula cuando es verdadera. 
Un error de tipo II implica no rechazar H 0 cuando H 0 es falsa. 


En el problema de contenido de nicotina, un error de tipo I consiste en rechazar la afirma¬ 
ción del fabricante de que ¡jl = 1.5 cuando en realidad es cierta. Si se emplea la región de 
rechazo x > 1.6 podría suceder que x = 1.63 aun cuando ¡i = 1.5, con el resultado de un 
error de tipo I. Alternativamente, puede ser que H 0 sea falsa y no obstante x = 1.52, lo que 
conduciría a que H 0 no sea rechazada (un error de tipo II). 

En el mejor de todos los mundos posibles, se podrían desarrollar procedimientos de 
prueba en los cuales ningún tipo de error es posible. Sin embargo, este ideal puede ser al¬ 
canzado sólo si la decisión se basa en el examen de toda la población. La dificultad con la 
utilización de un procedimiento basado en datos muéstrales es que debido a la variabilidad 
del muestreo, el resultado podría ser una muestra no representativa. Aun cuando E(X) = /i, 
el valor observado x puede diferir sustancialmente de ¡jl (por lo menos si n es pequeño). Por 
consiguiente cuando ¡x = 1.5 en la situación de la nicotina, x puede ser mucho más grande 
que 1.5 y el resultado sería el rechazo erróneo de H 0 . Alternativamente, puede ser que ¡x = 1.6 
y no obstante que se observe una x mucho más pequeña que este valor, lo que conduce a un 
error de tipo II. 

En lugar de demandar procedimientos sin errores, habrá que buscar procedimientos 
con los cuales sea improbable que ocurra cualquier tipo de error. Es decir, un buen proce¬ 
dimiento es uno con el cual la probabilidad de cometer cualquier tipo de error es pequeña. 
La selección de un valor de corte en una región de rechazo particular fija las probabilidades 
de errores de tipo I y tipo II. Estas probabilidades de error son tradicionalmente denotadas 
por a y /3, respectivamente. Como H 0 , especifica un valor único del parámetro, existe un so¬ 
lo valor de a. Sin embargo, existe un valor diferente de ¡3 por cada valor del parámetro com¬ 
patible con // a : 

Ejemplo 8.1 Se sabe que un cierto tipo de automóvil no sufre daños visibles el 25% del tiempo en prue¬ 
bas de choque a 10 mph. Se ha propuesto un diseño de defensa modificado en un esfuerzo 
por incrementar este porcentaje. Sea p la proporción de todos los choques a 10 mph con es¬ 
ta nueva defensa en los que no producen daños visibles. Las hipótesis a ser tratadas son H 0 : 
p = 0.25 (ninguna mejora contra // a : p > 0.25. La prueba se basará en un experimento que 
implica n = 20 choques independientes con prototipos del nuevo diseño. Intuitivamente, H 0 
deberá ser rechazada si un número sustancial de los choques no muestra daños. Considére¬ 
se el siguiente procedimiento de prueba: 

Estadístico de prueba: X = número de choques sin daños visibles 

Región de rechazo: R 8 = {8, 9, 10, ... , 19, 20); es decir, rechazar H {) si x > 8, 
donde x es el valor observado del estadístico de prueba. 

Esta región de rechazo se llama de cola superior y se compone de sólo grandes valores del 
estadístico de prueba. 

Cuando H 0 es verdadera, la distribución de probabilidad de X es binomial con n = 20 
y p = 0.25. Entonces 

a = P(e rror de tipo I) = P(H 0 es rechazada cuando es verdadera) 

= P(X > 8 cuando X ~ Bin(20, 0.25)) = 1 - 5(7; 20, 0.25) 

= 1 - 0.898 = 0.102 

Es decir, cuando H 0 en realidad es verdadera, aproximadamente el 10% de todos los expe¬ 
rimentos compuestos de 20 choques darían por resultado que H 0 fuera rechazada incorrec¬ 
tamente (un error de tipo I). 
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En contraste con a, no hay una sola ¡3. En su lugar, hay una ¡3 diferente por cada p di¬ 
ferente que exceda de 0.25. Por consiguiente hay un valor de [3 con p = 0.3 (en cuyo caso 
X ~ Bin(20, 0.3), otro valor de ¡3 con p = 0.5 y así sucesivamente. Por ejemplo, 

/3(0.3) = P(error de tipo II cuando p = 0.3) 

= P(H 0 no es rechazada cuando es falsa porque p = 0.3) 

= P(X < 7 cuando X ~ Bin(20, 0.3)) = 5(7; 20, 0.3) = 0.772 

Cuando p es en realidad 0.3 y no 0.25 (un “pequeño” alejamiento de /7 0 ), ¡aproximadamen¬ 
te el 77% de todos los experimentos de este tipo darían por resultado que H 0 fuera incorrec¬ 
tamente rechazada! 

La tabla adjunta muestra ¡3 para valores seleccionados de p (cada uno calculado para 
la región de rechazo K x ). Claramente, ¡3 disminuye conforme el valor de p se aleja hacia la 
derecha del valor nulo 0.25. Intuitivamente, mientras más grande es el alejamiento de H 0 , 
menos probable es que dicho alejamiento no sea detectado. 



p 

0.3 

0.4 

0.5 

0.6 

0.7 

0.8 

ÍKp) 

0.772 

0.416 

0.132 

0.021 

0.001 

0.000 


El procedimiento de prueba propuesto sigue siendo razonable para poner a prueba la 
hipótesis nula más realista de que p < 0.25. En este caso, ya no existe una sola a, sino que 
hay una por cada p que sea cuando mucho de 0.25: «(0.25), a(0.23), «(0.20), a(0.15) y así 
sucesivamente. Es fácil verificar, no obstante, que a(p) < «(0.25) = 0.102 si p < 0.25. Es 
decir, el valor más grande de « ocurre con el valor límite 0.25 entre H 0 y H. á . Por consiguien¬ 
te si a es pequeña para la hipótesis nula simplificada, también igual o más pequeña para la 
H 0 realista. ■ 

Ejemplo 8.2 Se sabe que el tiempo de secado de un cierto tipo de pintura en condiciones de prueba es¬ 
pecificadas está normalmente distribuido con valor medio de 75 min y desviación estándar 
de 9 min. Algunos químicos propusieron un nuevo aditivo para reducir el tiempo de secado. 
Se cree que los tiempos de secado con este aditivo permanecerán normalmente distribuidos 
con cr=9. Debido al gasto asociado con el aditivo, la evidencia deberá sugerir fuertemen¬ 
te una mejora en el tiempo de secado promedio antes de que se adopte semejante conclu¬ 
sión. Sea ¡jl el tiempo de secado promedio verdadero cuando se utiliza el aditivo. Las 
hipótesis apropiadas son H 0 \ ¡jl = 75 contra //,/ p. <15. Sólo si //„ puede ser rechazada se¬ 
rá declarado exitoso y utilizado. 

Los datos experimentales tienen que estar compuestos de tiempos de secado de n = 25 
especímenes de prueba. Sean X { , . . . , X 25 los 25 tiempos de secado, una muestra aleatoria 
de tamaño 25 de una distribución normal con valor medio ¡jl y desviación estándar cr = 9. 
El tiempo de secado medio muestral X tiene entonces una distribución normal con valor 
esperado /rj = p- y desviación estándar crj = rr/Vn = 9/V25 = 1.80. Cuando H 0 es ver¬ 
dadera, p^x = 75, así que un valor x un poco menor que 75 no contradeciría fuertemente a 
Hg. Una región razonable de rechazo tiene la forma X < c, donde el valor de corte c es ade¬ 
cuadamente seleccionado. Considere la opción c = 70.8, de modo que el procedimiento de 
prueba se componga del estadístico de prueba X y una región de rechazo x < 70.8. Debido a 
que la región de rechazo se compone de sólo valores pequeños del estadístico de prueba, se 
dice que ésta es de cola pequeña. El cálculo de ay ¡3 ahora implica una estandarización de 
rutina de X seguida por una referencia a las probabilidades normales estándar de la tabla A.3: 


a = /terror de tipo I) = P(H 0 es rechazada cuando es verdadera) 
= P(X < 70.8 cuando X ~ normal con p.% = 75, cr^ = 1.8) 
70.8 - 75 


= cf> 


= 0>(-2.33) = 0.01 



1.8 
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J8(72) 


J8(70) 


/t error de tipo II cuando ¡jl = 72) 

P(H 0 no es rechazada cuando es falsa porque ¡i = 72) 

P(X > 70.8 cuando X ~ normal con ¡jl^ = 72 y cr^ = 1.8) 

j = 1 - $(-0.67) = 1 - 0.2514 = 0.7486 
) = 0.3300 ¡3(61) = 0.0174 


1 - $1 


70.8 - 
1.8 


1 - $ 


70.8 


1.8 


Con el procedimiento de prueba especificado, sólo el 1% de todos los experimentos realiza¬ 
dos como se describió darán por resultado que H 0 sea rechazada cuando en realidad es ver¬ 
dadera. No obstante, la probabilidad de un error de tipo II es muy grande cuando ¡jl = 72 
(sólo un pequeño alejamiento de H 0 ), un poco menor cuando ¡i = 70 y bastante pequeño 
cuando ¡jl = 67 (un alejamiento muy sustancial de H 0 ). Estas probabilidades de error se ilus¬ 
tran en la figura 8.1. Obsérvese que a se calcula con la distribución de probabilidad del es¬ 
tadístico de prueba cuando H 0 es verdadera, en tanto que la determinación de [3 requiere 
conocer la distribución del estadístico cuando H 0 es falsa. 




c) 


Figura 8.1 a y ¡3 ilustradas para el ejemplo 8.2: a) la distribución de X cuando /j, = 75 (H 0 ver¬ 
dadera); b) la distribución de X cuando /x = 72 ( H 0 falsa); c) la distribución de X cuando /x = 70 
(H 0 falsa). 


Como en el ejemplo 8.1, si se considera la hipótesis nula más realista /x > 75, existe 
una a por cada valor de parámetro con el cual H 0 es verdadera: a (75), a(75.8), a(76.5), y 
así sucesivamente. Es fácil verificar que a( 75) es la más grande de todas estas probabilida¬ 
des de error de tipo I. Enfocándose en el valor límite equivale a trabajar explícitamente con 
el “peor caso”. ■ 
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La especificación de un valor de corte para la región de rechazo en los ejemplos que 
se acaban de considerar fue algo arbitraria. El uso de R s = {8, 9,. . ., 20} en el ejemplo 8.1 
dio por resultado a = 0.102, ¡3(0.3) = 0.772 y ¡3(0.5) = 0.132. Muchos pensarán que estas 
probabilidades de error son intolerablemente grandes. Quizá puedan reducirse si se cambia 
el valor de corte. 


Ejemplo 8.3 

(continuación 
del ejemplo 
8 . 1 ) 


Utilice el mismo experimento y el estadístico de prueba X como previamente se descri¬ 
bió en el problema de la defensa de automóvil pero ahora considere la región de recha¬ 
zo R 9 = {9, 10, . . . , 20}. Como X sigue teniendo una distribución binomial con 
parámetros n = 20 y p, 


a = P(H 0 es rechazada cuando p = 0.25) 

= P(X > 9 cuando X ~ Bin(20, 0.25)) = 1 - B( 8; 20, 0.25) = 0.041 


La probabilidad de error de tipo I se redujo con el uso de la nueva región de rechazo. Sin 
embargo, se pagó un precio por esta reducción: 

¡3(0.3) = P(H 0 no es rechazada cuando p = 0.3) 

= P(X < 8 cuando X ~ Bin(20, 0.3)) = B( 8; 20, 0.3) = 0.887 
¡3(0.5) = B( 8; 20, 0.5) = 0.252 

Ambas ¡3 son más grandes que las probabilidades de error correspondientes 0.772 y 0.132 
para la región R H . En retrospectiva, no es sorprendente; a se calcula sumando las probabili¬ 
dades de los valores estadísticos de prueba en la región de rechazo, en tanto que ¡3 es la pro¬ 
babilidad de que X quede en el complemento de la región de rechazo. Al hacerse más 
pequeña la región de rechazo debe reducirse a al mismo tiempo que se incrementa ¡3 con 
cualquier valor alternativo fijo del parámetro. ■ 


Ejemplo 8.4 

(continuación 
del ejemplo 
8 . 2 ) 


El uso del valor de corte c = 70.8 en el ejemplo de secado de la pintura dio por resultado 
un valor de a muy pequeño (0.01) pero ¡3 grande. Considere el mismo experimento y prue¬ 
be el estadístico de prueba X con la nueva región de rechazo 3t < 72. Como X sigue siendo 
normalmente distribuida con valor medio p% = p y crj = 1.8, 


a = P(H 0 es rechazada cuando es verdadera) 

= P(X < 72 cuando X ~ N(15, 1.8 2 )) 

= < b( 72 | ~ s 7 ~ j = $(-1.67) = 0.0475 « 0.05 


¡3(12) = P(H 0 no es rechazada cuando p = 72) 

= P(X >72 cuando X es una variable aleatoria normal con media de 72 y desvia¬ 
ción estándar de 1.8) 

= 1 - <&( 72 ~ 8 ~) = 1 ~ *0, = 0.5 

\ = 0.1335 ¡3(61) = 0.0027 

El cambio del valor de corte agrandó la región de rechazo (incluye más valores de x y el re¬ 
sultado es una reducción de ¡3 por cada p fija menor que 75. Sin embargo, a en esta nueva 
región se ha incrementado desde el valor previo 0.01 hasta aproximadamente 0.05. Si una 
probabilidad de error de tipo I así de grande puede ser tolerada, se prefiere la segunda re¬ 
gión (c = 72) a la primera (c = 70.8) debido a las ¡3 más pequeñas. ■ 


0(70) = 1 -$1^ 



Los resultados de estos ejemplos pueden ser generalizados de la siguiente manera. 





















CAPÍTULO 8 Pruebas de hipótesis basadas en una sola muestra 


PROPOSICIÓN 


Supóngase que un experimento y un tamaño de muestra están fijos y que se seleccio¬ 
na un estadístico de prueba. Entonces si se reduce el tamaño de la región de rechazo 
para obtener un valor más pequeño de a se obtiene un valor más grande de ¡3 con cual¬ 
quier valor de parámetro particular compatible con H d . 


Esta proposición expresa que una vez que el estadístico de prueba y n están fijos, no existe 
una región de rechazo que haga que al mismo tiempo a y (3 sean pequeños. Se debe selec¬ 
cionar una región para establecer un compromiso entre a y ¡3. 

Debido a las indicaciones sugeridas para especificar H 0 y ll d , casi siempre un error 
de tipo I es más serio que uno de tipo II (esto en general se puede lograr mediante la se¬ 
lección apropiada de las hipótesis). El método seguido por la mayoría de los practicantes 
de la estadística es especificar el valor más grande de a que pueda ser tolerado y encontrar 
una región de rechazo que tenga valor de a en lugar de cualquier otro más pequeño. Esto 
hace a f3 tan pequeño como sea posible sujeto al límite en a. El valor resultante de a 
a menudo se conoce como nivel de significación de la prueba. Niveles tradicionales 
de significación son 0.10, 0.05 y 0.01, aunque el nivel en cualquier problema particular de¬ 
penderá de la seriedad de un error de tipo I: mientras más serio es este error, más pequeño 
deberá ser el nivel de significación. El procedimiento de prueba correspondiente se llama 
prueba de nivel a (p. ej., prueba de nivel 0.05 o prueba de nivel 0.01). Una prueba con ni¬ 
vel de significación a es una donde la probabilidad de error de tipo 1 se controla al nivel 
especificado. 

Ejemplo 8.5 


Considere la situación previamente mencionada en la cual ¡jl era el contenido de nicotina 
promedio verdadero de los cigarrillos marca B. El objetivo es probar H 0 : n = 1.5 contra H d : 
¡ju > 1.5 con base en una muestra aleatoria X¡, X 2 ,.. . , X 32 de contenido de nicotina. Supon¬ 
ga que se sabe que la distribución del contenido de nicotina es normal con cr = 0.20. Enton¬ 
ces X está normalmente distribuida con valor medio =¡jl y desviación estándar crj = 
0.20/ V32 = 0.0354. 

En lugar de utilizar X como estadístico de prueba, se estandariza X suponiendo que //„ 
es verdadera. 


X — 1.5 X-1.5 

Estadístico de prueba: Z = - ~¡=~ = - 

v a/Vn 0.0354 

Z expresa la distancia entre X y su valor esperado cuando H 0 es verdadera como algún nú¬ 
mero de desviaciones estándar. Por ejemplo, z = 3 resulta de una x que es 3 desviaciones 
estándar más grande de lo que se habría esperado si H 0 fuera verdadera. 

Rechazar H 0 cuando 3c excede “considerablemente” de 1.5 equivale a rechazar H 0 
cuando z excede “considerablemente” de cero. Es decir, la forma de la región de rechazo es 
Z > c. Determínese ahora c de modo que a = 0.05. Cuando H 0 es verdadera, Z tiene una 
distribución estándar normal. Por consiguiente 

a = P(e rror de tipo I) = PCrechazar H 0 cuando //„ es verdadera) 

= P(Z > c cuando Z ~ N(0, 1)) 

El valor de c debe capturar el área de la cola superior 0.05 bajo la curva z. O de la sección 
4.3 o directamente de la tabla A.3, c = z 005 = 1.645. 

Obsérvese que z > 1.645 equivale a x — 1.5 & (0.0354)(1.645), es decir, x > 1.56. 
Entonces ¡3 es la probabilidad de que X < 1.56 y puede ser calculada con cualquier ¡jl ma¬ 
yor que 1.5. ■ 
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EJERCICIOS Sección 8.1 (1-14) 


1. Por cada una de las siguientes aseveraciones, exprese si es 
una hipótesis estadística legítima y por qué: 

a. H:a> 100 b. H: x = 45 

c. H: s_< 0.20 d. H: cr/cjj < 1 

e. H: X — Y = 5 

f. H: A £ 0.01 donde A es el parámetro de una distribución 
exponencial utilizada para modelar la vida útil de un 
componente. 

2. Para los siguientes pares de aseveraciones, indique cuáles 
no satisfacen las reglas de establecer hipótesis y por qué 
(los subíndices 1 y 2 diferencian las cantidades de dos po¬ 
blaciones o muestras diferentes). 


a. 

H 0 : 

P 

O 

O 

II 

, ff a : /x > 100 

b. 

H 0 : 

cr 

= 20,, 

H - cr < 20 

c. 

H 0 : 

P 

A 0.25 

,H¿P = 0-25 

d. 

H 0 - 

Pl 

- p 2 

= 25, H¿. p, - 

e. 

H 0 : 

Si 

= 5 2 
J 2’ 

H- S\ A S 2 

f. 

H 0 : 

p 

II 

O 

, 7/ a : ¿x = 150 

g- 

H 0 : 

°"l 

/cr 2 = 

1, í/ a : <Tj/cr 2 A 1 

h. 

H 0 : 

Pl 

- Pl = 

= -0.1, í/ a : Pl — 


3. Para determinar si las soldaduras de las tuberías en una 
planta de energía nuclear satisfacen las especificaciones, se 
selecciona una muestra aleatoria de soldaduras y se realizan 
pruebas en cada una de las soldaduras. La resistencia de la 
soldadura se mide como la fuerza requerida para romperla. 
Suponga que las especificaciones indican que la resistencia 
media de las soldaduras deberá exceder de 100 lb/pulg 2 ; el 
equipo de inspección decide probar H a \ p = 100 contra // a : 
p > 100. Explique por qué podría ser preferible utilizar 
esta H 3 en lugar de p < 100. 

4. Sea p el nivel de radioactividad promedio verdadero (pico- 
curies por litro). Se considera que el valor 5 pCi/L es la lí¬ 
nea divisoria entre agua segura e insegura. ¿Recomendaría 
probar H 0 : p = 5 contra H a : p> 5 o H 0 : p = 5 contra // a : 
p < 5? Explique su razonamiento. [ Sugerencia : Piense en 
las consecuencias de un error de tipo I o de un error de tipo 
II con cada posibilidad.] 

5. Antes de aprobar un gran pedido de fundas de polietileno 
para un tipo particular de cable de energía submarino relle¬ 
no de aceite a alta presión, una compañía desea contar con 
evidencia conclusiva de la desviación estándar verdadera 
del espesor de la funda es de menos de 0.05 mm. ¿Qué hi¬ 
pótesis deberán ser probadas y por qué? En este contexto, 
¿Cuáles son los errores de tipo I y II? 

6. Muchas casas viejas cuentan con sistemas eléctricos que uti¬ 
lizan fusibles en lugar de cortacircuitos. Un fabricante de fu¬ 
sibles de 40 amp desea asegurarse de que el amperaje medio 
al cual se queman sus fusibles es en realidad de 40. Si el am¬ 
peraje medio es menor que 40, los clientes se quejarán porque 
los fusibles tienen que ser reemplazados con demasiada fre¬ 
cuencia. Si el amperaje medio es de más de 40, el fabricante 
podría ser responsable de los daños que sufra un sistema eléc¬ 
trico a causa del funcionamiento defectuoso de los fusibles. 
Para verificar el amperaje de los fusibles, se selecciona e ins¬ 
pecciona una muestra de fusibles. Si tuviera que realizarse 
una pmeba de hipótesis con los datos resultantes, ¿Qué hipó¬ 


tesis nula y alternativa sería de interés para el fabricante? Des¬ 
criba los errores de tipo I y II en el contexto de este problema. 

7. Se toman muestras de agua utilizada para enfriamiento al mo¬ 
mento de ser descargada por una planta de energía en un río. 
Se ha determinado que en tanto la temperatura media del agua 
descargada sea cuando mucho de 150°F, no habrá efectos ne¬ 
gativos en el ecosistema del río. Para investigar si la planta 
cumple con los reglamentos que prohíben una temperatura 
media por encima de 150° del agua de descarga, se tomarán al 
azar 50 muestras de agua y se registrará la temperatura de ca¬ 
da muestra. Los datos resultantes se utilizarán para probar la 
hipótesis H 0 : p = 150° contra H¿. p > 150°. En el contexto 
de esta situación, describa los errores de tipo I y tipo II. ¿Qué 
tipo de error consideraría más serio? Explique. 

8. Un tipo regular de laminado está siendo utilizado por un fa¬ 
bricante de tarjetas de circuito. Un laminado especial ha si¬ 
do desarrollado para reducir el alabeo. El laminado regular 
será utilizado en una muestra de especímenes y el laminado 
especial en otra muestra y se determinará entonces la canti¬ 
dad de alabeo en cada espécimen. El fabricante cambiará 
entonces al laminado especial sólo si puede demostrar que 
la cantidad de alabeo promedio verdadera de dicho lamina¬ 
do es menor que la del laminado regular. Formule las hipó¬ 
tesis pertinentes y describa los errores de tipo I y de tipo II 
en el contexto de esta situación. 

9. Dos compañías diferentes han solicitado proporcionar el 
servicio de televisión por cable en una cierta región. Sea p 
la proporción de todos los suscriptores potenciales que 
favorecen a la primera compañía sobre la segunda. Consi¬ 
dere probar H 0 : p — 0.5 contra H¿. p A 0.5 basado en una 
muestra aleatoria de 25 individuos. Sea X el número en 
la muestra que favorece a la primera compañía y x el valor 
observado de X. 

a. ¿Cuál de las siguientes regiones de rechazo es más apro¬ 
piada y por qué? 

/?! = {x: x £ 7 o x S 18), R 2 = {x: x £ 8}, 

R 3 = {x:x> 17] 

b. En el contexto de este problema, describa cuáles son los 
errores de tipo I y de tipo II. 

c. ¿Cuál es la distribución de probabilidad del estadístico 
de prueba X cuando H 0 es verdadera? Usela para calcu¬ 
lar la probabilidad de un error de tipo I. 

d. Calcule la probabilidad de un error de tipo II en la región 
seleccionada cuando p = 0.3, otra vez cuando p = 0.4 y 
también con p = 0.6 y p = 0.7. 

e. Utilizando la región seleccionada, ¿qué concluiría si 6 de 
los 25 individuos encuestados favorecen a la compañía 1? 

10. Una mezcla de cenizas combustibles pulverizadas y cemento 
Portland utilizada para rellenar con lechada deberá tener 
una resistencia a la compresión de más de 1300 KN/m 2 . 
La mezcla no será utilizada a menos que la evidencia expe¬ 
rimental indique concluyentemente que la especificación de 
resistencia ha sido satisfecha. Suponga que la resistencia a 
la compresión de especímenes de esta muestra está normal¬ 
mente distribuida con cr = 60. Sea /x la resistencia a la com¬ 
presión promedio verdadera. 
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a. ¿Cuáles son las hipótesis nula y alternativa apropiadas? 

b. Sea X la resistencia a la compresión promedio muestral 
de n — 20 especímenes seleccionados al azar. Conside¬ 
re el procedimiento de prueba con estadístico de prueba 
X y región de rechazo x a 1331.26. ¿Cuál es la distribu¬ 
ción de probabilidad del estadístico cuando H 0 es verda¬ 
dera? ¿Cuál es la probabilidad de un error de tipo I para 
el procedimiento de prueba? 

c. ¿Cuál es la distribución de probabilidad del estadístico 
de prueba cuando ¡x = 1350? Utilizando el procedimien¬ 
to de prueba de la parte (b), ¿cuál es la probabilidad de 
que la mezcla será juzgada insatisfactoria cuando en rea¬ 
lidad fx = 1350 (un error de tipo II)? 

d. ¿Cómo cambiaría el procedimiento de prueba de la par¬ 
te (b) para obtener una prueba con nivel de significación 
de 0.05? ¿Qué impacto tendría este cambio en la proba¬ 
bilidad de error de la parte (c)? 

e. Considere el estadístico de prueba estandarizado Z = 
(X - 1300 )/(a/Vñ) = (A - 1300)/13.42. ¿Cuáles son los 
valores de Z correspondientes a la región de rechazo de 
la parte (b)? 

11. La calibración de una báscula tiene que ser verificada pe¬ 
sando 25 veces un espécimen de prueba de 10 kg. Suponga 
que los resultados de diferentes pesadas son independientes 
entre sí y que el peso en cada ensayo está normalmente dis¬ 
tribuido con cr = 0.200 kg. Sea ¡x la lectura de peso prome¬ 
dio verdadero en la báscula. 

a. ¿Qué hipótesis deberá poner a prueba? 

b. Suponga que la báscula tiene que ser recalibrada si o 
x £: 10.1032 orí 9.8968. ¿Cuál es la probabilidad de 
que se realice la recalibración cuando en realidad no es 
necesaria? 

c. ¿Cuál es la posibilidad de que la recalibración sea 
considerada innecesaria cuando en realidad fx = 10.1? 
¿Cuándo ¿i = 9.8? 

d. Sea z = ( x — 10)/((x/Vñ). ¿Con qué valor de c la región 
de rechazo de la parte (b) equivale a la región de “dos 
colas” o z s c o z ^ —c? 

e. Si el tamaño de muestra fue de sólo 10 y no de 25, ¿cómo 
modificaría el procedimiento de la parte (d) de modo que 
a = 0.05? 

f. Utilizando la prueba de la parte (e), ¿qué concluiría ba¬ 
sado en los siguientes datos muéstrales: 

9.981 10.006 9.857 10.107 9.888 
9.728 10.439 10.214 10.190 9.793 


g. Exprese de nuevo el procedimiento de prueba de la par¬ 
te (b) en función del estadístico de prueba estandarizado 
Z = (X - 10)/(o-/Vñ). 

12. Un nuevo diseño del sistema de frenos de un cierto tipo de 
carro ha sido propuesto. Para el sistema actual, se sabe que la 
distancia de frenado promedio verdadera a 40 mph en condi¬ 
ciones específicas es de 120 pies. Se propone que el nuevo 
diseño sea implementado sólo si los datos muéstrales indi¬ 
can fuertemente una reducción de la distancia de frenado 
promedio verdadera del nuevo diseño. 

a. Defina el parámetro de interés y formule las hipótesis 
pertinentes. 

b. Suponga que la distancia de frenado del nuevo sistema 
está normalmente distribuido con cr = 10. Sea X la dis¬ 
tancia de frenado promedio de una muestra de 36 obser¬ 
vaciones. ¿Cuáles de las siguientes regiones de rechazo 
es apropiada: R¡ = [x: La 124.80), R 1 = [x: x ^ 
115.20), R } = {x\ ox> 125.13 oí< 114.87}? 

c. ¿Cuál es el nivel de significación de la región apropiada 
de la parte (b)? ¿Cómo cambiaría la región para obtener 
una prueba con a = 0.001? 

d. ¿Cuál es la probabilidad de que el nuevo diseño no sea 
implementado cuando la distancia de frenado promedio 
verdadera sea en realidad de 115 pies y la región apro¬ 
piada de la parte (b) sea utilizada? 

e. Sea Z = (X — 120)/(<x/Vñ). ¿Cuál es el nivel de signifi¬ 
cación de la región de rechazo {z: z £ —2.33}? ¿Para la 
región {z: z < -2.88}? 

13. Sean X¡, . . . , X n una muestra aleatoria de una distribución 
de población normal con un valor conocido de cr. 

a. Para probar las hipótesis H 0 : /x = /x 0 , contra // a : /jl > ¡x 0 
(donde ¡x 0 es un número fijo), demuestre que la prueba con 
el estadístico X y región de rechazo ~x a /x 0 + 2.33<r/Vn 
tiene un nivel de significación de 0.01. 

b. Suponga que se utiliza el procedimiento de la parte (a) 
para probar H 0 : /ií/i, contra H a \ fx > /x 0 . Si /x 0 = 100, 
n = 25 y cr = 5, ¿cuál es la probabilidad de cometer un 
error de tipo I cuando ¡x = 99? ¿Cuándo fx = 98? En ge¬ 
neral, ¿qué se puede decir sobre la probabilidad de un 
error de tipo I cuando el valor real de ¡x es menor que 
/x 0 ? Verifique su aseveración. 

14. Reconsidere la situación del ejercicio 11 y suponga que la 
región de rechazo es ¡L: Is 10.1004 o L £ 9.8940} = 
{z:z>2.51 oz<-2.65¡. 

a. ¿Cuál es a para este procedimiento? 

b. ¿Cuál es j8 cuando ¡x = 10.1? ¿Cuándo fx = 9.9? ¿Es 
ésta deseable? 



8.2 Pruebas sobre una media de población 


La discusión general en el capítulo 7 de intervalos de confianza para una media de pobla¬ 
ción se enfocó en tres casos diferentes. A continuación se desarrollan procedimientos para 
estos mismos tres casos. 

Caso I: Una población normal con o- conocida 

Aun cuando la suposición de que el valor de cr es conocido rara vez se cumple en la prác¬ 
tica, este caso proporciona un buen punto de partida debido a la facilidad con que los 
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procedimientos generales y sus propiedades pueden ser desarrollados. La hipótesis nula en 
los tres casos propondrá que ¡jl tiene un valor numérico particular, el valor nulo, el cual se¬ 
rá denotado por /jl,,. Sean X,, . . . , X n una muestra aleatoria de tamaño n de la población 
normal. Entonces la media muestral X tiene una distribución normal con valor esperado 
/rj = /ry desviación estándar oj = cr/Vñ. Cuando H„ es verdadera /jl^ = /jl 0 . Considére¬ 
se ahora el estadístico Z obtenido estandarizando X de conformidad con la suposición de 
que H 0 es verdadera: 

X- p 0 
<j¡\fn 

Al sustituir la media muestral calculada x se obtiene z, la distancia entre 3t y /i 0 expresada 
en “unidades de desviación estándar”. Por ejemplo, si la hipótesis nula es H 0 : /jl = 100, 
ctx = <r/Vñ = 10/V25 = 2.0 y x = 103, entonces el valor estadístico de prueba es z = 
(103 - 100)/2.0 = 1.5. Es decir, el valor observado de x es 1.5 desviaciones estándar (de X) 
más grande de lo que se espera sea cuando H 0 es verdadera. El estadístico Z es una medida 
natural de la distancia X, el estimador de p y su valor esperado cuando H 0 es verdadera. Si 
esta distancia es demasiado grande en una dirección consistente con H a , la hipótesis nula de¬ 
berá ser rechazada. 

Supóngase primero que la hipótesis alternativa tiene la forma H ñ : ¡jl > /jl 0 . Entonces 
un valor de x menor que ¡jl,, indudablemente no apoya a II.,. Tal 3c corresponde a un valor ne¬ 
gativo de z (puesto que x — p 0 es negativa y el divisor de cr/Vñ es positivo). Del mismo 
modo, un valor de 3c que exceda de /jl„ por sólo una pequeña cantidad (correspondiente a z 
la cual es positiva aunque pequeña) no sugiere que H 0 deberá ser rechazada a favor de II.,. 
El rechazo de H 0 es apropiado sólo cuando x excede considerablemente de p 0 , es decir, 
cuando el valor de z es positivo y grande. En suma, la región de rechazo apropiada basada 
en el estadístico de prueba Z en lugar de X tiene la forma " > c. 

Como se discutió en la sección 8.1, el valor de corte c deberá ser elegido para contro¬ 
lar la probabilidad de un error de tipo I al nivel a deseado. Esto es fácil de lograr porque la 
distribución del estadístico de prueba Z cuando H 0 es verdadera es la distribución normal es¬ 
tándar (es por eso que p 0 se restó al estandarizar). El valor c de corte requerido es el valor 
crítico z que captura el área de la cola superior a bajo la curva z. Como ejemplo, sea c = 
1.645, el valor que captura el área de cola 0.05 (z 005 = 1.645). Entonces, 

a = P(e rror de tipo I) = P(H 0 es rechazada cuando H„ es verdadera) 

= P(Z > 1.645 cuando Z ~ N( 0, 1)) = 1 - $(1.645) = 0.05 

Más generalmente, la región de rechazo z>; 0 tiene un probabilidad de error de tipo I a. El 
procedimiento de prueba es de cola superior porque la región de rechazo se compone de só¬ 
lo valores grandes del estadístico de prueba. 

Un razonamiento análogo para la hipótesis alternativa II,p. < ¡jl,, sugiere una región 
de rechazo de la forma z ^ c, donde c es un número negativo adecuadamente seleccionado 
(x aparece muy debajo de ¡jl,, si y sólo si z es bastante negativo). Como Z tiene una distribu¬ 
ción normal estándar cuando H 0 es verdadera, con c = — z a da /Terror de tipo I) = a. Esta 
es una prueba de cola inferior. Por ejemplo, z 010 = 1.28 implica que la región de rechazo 
Z < —1.28 especifica una prueba con nivel de significación de 0.10. 

Por último, cuando la hipótesis alternativa es H a : p A ¡jl,,. H„ deberá ser rechazada si 
x está muy lejos a ambos lados de ¡jl,,. Esto equivale a rechazar //,, si z > c o si z 2 / — c. Su¬ 
póngase que se desea a = 0.05. Entonces, 

0.05 = P(Z >coZ< — c cuando Z tiene una distribución normal estándar) 

= $(-c) + 1 - $(c) = 2[1 - $(c)] 

Por consiguiente c es tal que 1 — $(c), el área bajo la curva z a la derecha de c, es 0.025 (¡y 
no 0.05!). De acuerdo con la sección 4.3 o la tabla A.3, c = 1.96 y la región de rechazo 
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^ > 1.96 o z — —1.96. Con cualquier a, la región de rechazo de dos colas z 2= z rxJ2 ° 
Z < — z nl2 tiene una probabilidad a de error de tipo I (puesto que el área al 2 está capturada 
debajo de cada una de las dos colas de la curva z). De nueva cuenta, la razón clave para uti¬ 
lizar el estadístico de prueba estandarizado Z es que como Z tiene una distribución conoci¬ 
da cuando H 0 es verdadera (estándar normal), es fácil de obtener una región de rechazo con 
probabilidad de error de tipo I mediante un valor crítico apropiado. 

El procedimiento de prueba en el caso I se resume en el cuadro adjunto y las regiones 
de rechazo correspondientes se ilustran en la figura 8.2. 


Hipótesis nula: H 0 : ¡jl = ¡jl 0 


Valor del estadístico de prueba: 

_ * - Po 
cr/\/ñ 

Hipótesis alternativa 

Reglón de rechazo para la prueba de nivel a 

H. d '■ p > Ib, 

Z > z a (prueba de cola superior) 

P < P o 

Z —z„ (prueba de cola inferior) 

H a : p * p 0 o 

Z & Z al2 0 z — z a / 2 (prueba de dos colas) 



Curva z (distribución de probabilidad del estadístico de prueba Z cuando Hq es verdadera) 




Figura 8.2 Regiones de rechazo para pruebas z: a) prueba de cola superior; b) prueba de 
cola inferior; c) prueba de dos colas. 


Se recomienda utilizar la siguiente secuencia de pasos cuando se prueben hipótesis con res¬ 
pecto a un parámetro. 

1. Identificar el parámetro de interés y describirlo en el contexto de la situación del pro¬ 
blema. 

2. Determinar el valor nulo y formular la hipótesis nula. 

3. Formular la hipótesis alternativa apropiada. 

4. Dar la fórmula para el valor calculado del estadístico de prueba (sustituyendo el valor 
nulo y los valores conocidos de cualquier otro parámetro, pero no aquellos de cualquier 
cantidad basada en una muestra). 
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5. Establecer la región de rechazo para el nivel de significación seleccionado a. 

6. Calcular cualquier cantidad muestral necesaria, sustituir en la fórmula para el estadísti¬ 
co de prueba y calcular dicho valor. 

7. Decidir si H 0 debe ser rechazada y expresar esta conclusión en el contexto del pro¬ 
blema. 

La formulación de hipótesis (pasos 2 y 3) deberá ser realizada antes de examinar los datos. 


Un fabricante de sistemas rociadores utilizados como protección contra incendios en edifi¬ 
cios de oficinas afirma que la temperatura de activación del sistema promedio verdadera es 
de 130°. Una muestra de n = 9 sistemas, cuando se somete a prueba, da una temperatura de 
activación promedio muestral de 131.08°F. Si la distribución de los tiempos de activación 
es normal con desviación estándar de 1.5°F, ¿contradicen los datos la afirmación del fabri¬ 
cante a un nivel de significación a = 0.01? 

1. Parámetro de interés: ¡jl = temperatura de activación promedio verdadera. 

2. Hipótesis nula: H 0 : /jl = 130 (valor nulo = fi 0 = 130). 

3. Hipótesis alternativa: //,/ ¡jl J= 130 (un alejamiento del valor declarado en una u otra di¬ 
rección es de interés). 

4. Valor de estadístico de prueba: 

3c — ju, 0 x — 130 
ít/Vm 1.5 A/ñ 


5. Región de rechazo: La forma de // a implica el uso de una prueba de dos colas con re¬ 
gión de rechazo o de z > z 0005 o z < —z 0 005 . De acuerdo con la sección 4.3 o la tabla 
A.3. z 0005 = 2.58, así que se rechazaría //,, si z > 2.58 oz< —2.58. 

6. Sustituyendo n = 9 y x = 131.08, 


131.08 - 130 
1.5/V9 


1.08 

0.5 


2.16 


Es decir, la media muestral observada es de un poco más de 2 desviaciones estándar so¬ 
bre el valor que era de esperarse si H 0 fuera verdadera. 

7. El valor calculado z = 2.16 no queda en la región de rechazo (—2.58 < 2.16 < 2.58), así 
que H 0 no puede ser rechazada al nivel de significación de 0.01. Los datos no apoyan fuer¬ 
temente la afirmación de que el promedio verdadero difiere del valor de diseño de 130. ■ 

¡i y determinación del tamaño muestral Las pruebas z para el caso 1 se encuentran entre 
las pocas en estadística para las cuales existen fórmulas simples para ¡3, la probabilidad de 
un error de tipo II. Considérese en primer lugar la prueba de cola superior con región de re¬ 
chazo z — Z„. Esta equivale a 3c > /j.„ + z a ■ cr/Vn, por lo que H 0 no será rechazada si 3c < 
¡x 0 + z a • crl\fn. Si ahora ¡± denota un valor particular de /jl que exceda el valor nulo ¡i 0 . 
Entonces, 


y8(/x') = P(H 0 es no rechazada cuando /jl = ¡i ') 
= P(X < ¡± {) + z ci ' cr/Vñ cuando ¡jl = ¡a') 


= P\ 


X - „ , Po ~ P-' 

< z„ -t - r~ cuando p, = ¡i 


= + 


a/\/n 

P-o ~ P-' 


T¡\Zn 


(Ti 


■rsín 


























c8_p284-324.qxd 3/12/08 4:17 AM Page 298 




298 CAPÍTULO 8 Pruebas de hipótesis basadas en una sola muestra 


Conforme /jl' se incrementa ¡jl 0 — ¡±' se vuelve más negativa, de modo que f3(fx') será pe¬ 
queña cuando ¡jl' excede /i 0 en gran medida (porque el valor con el que se evalúa $ será 
entonces bastante negativo). Las probabilidades de error para las pruebas de cola inferior 
y de dos colas se derivan de manera análoga. 

Si cr es grande, la probabilidad de un error de tipo II puede ser grande con un valor al¬ 
ternativo de ¡jl' que sea de interés particular para un investigador. Supóngase que se fija a y 
que también se especifica [3 para semejante valor alternativo. En el ejemplo de los sistemas 
rociadores, los oficiales de la compañía podrían considerar ¡jl' = 132 como un alejamiento 
muy sustancial de H 0 : /jl = 130 y desear por consiguiente [3( 132) = 0.10 además de a = 
0.01. Más generalmente, considérense las dos restricciones P(error de tipo I) = a y [3(/jl') 
= ¡3 para a, ¡j! y [3 especificadas. Entonces para una prueba de cola superior, el tamaño de 
muestra n debe ser elegido para satisfacer 



<jf\/n J 


P 


Esto implica que 


~ Z P 


valor z crítico que captura _ ^ p, 0 — ¡jl' 

el área de cola inferior [3 "" cr/Vu 


Es fácil resolver esta ecuación para el tamaño de muestra n deseado. Un argumento parale¬ 
lo da el tamaño de muestra necesario para las pruebas de cola inferior y de dos colas como 
se resume en el siguiente cuadro. 


Hipótesis Probabilidad de error de tipo II /3(/x.') 

alternativa para una prueba de nivel a 

* > *, 4 - + 

»,■ 1 “ 4 ’(" 2 - + 


donde <í>(z) = función de distribución acumulativa normal estándar. 

El tamaño de muestra n con el cual una prueba de nivel a también tiene ¡3(/jl') 
= (3 con el valor alternativo ¡i' es 


n = 


' I~ a(z a + z B ) p 


para una prueba de una cola 
(superior o inferior) 


cr ( z an z b) l 2 para una prueba de dos colas 
/¿o — /jl' (una solución aproximada) 



Ejemplo 8.7 Sea ¡jl la vida promedio verdadera de la banda de rodamiento de un cierto tipo de llanta. 

Considere poner a prueba H 0 : ¡jl = 30 000 contra H d : /jl > 30 000 basado en un tamaño de 
muestra n = 16 de una distribución de población normal con cr = 1500. Una prueba con 
a = 0.01 requiere z a = z 001 = 2.33. La probabilidad de cometer un error de tipo II cuando 
¡x = 31 000 es 


j8(31000) = $2.33 + 


30000 - 31000 
1500/V16 


$(-0.34) = 0.3669 
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Como z 0 ¡ = 1.28, el requerimiento de que el nivel de prueba 0.01 también tenga ¿3(31 000) 
= 0.1 necesita 

= [ 1500(2.33 + 1.28) 

[ 30000 - 31000 

El tamaño de muestra debe ser un entero, por lo tanto se deberán utilizar n = 30 llantas. ■ 

Caso II: Pruebas con muestras grandes 

Cuando el tamaño de muestra es grande, la pruebas z en el caso I son fáciles de modificar 
para dar procedimientos de prueba válidos sin requerir una distribución de población nor¬ 
mal o cr conocida. El resultado clave se utilizó en el capítulo 7 para justificar intervalos de 
confianza para muestra grande: Un tamaño de muestra grande n implica que la variable es¬ 
tandarizada 

y _ X~fL 

S/Vn 

tiene aproximadamente una distribución normal estándar. La sustitución del valor nulo p 0 
en lugar de ¡i da el estadístico de prueba 

_ X — /i-Q 

S/Vn 

la que tiene aproximadamente una distribución normal estándar cuando H 0 es verdadera. El 
uso de las regiones de rechazo dadas previamente para el caso I (p. ej., cuando la hi¬ 

pótesis alternativa es H¿. ¡jl > p, 0 ) produce entonces procedimientos de prueba con los cua¬ 
les el nivel de significación es aproximadamente (y no exactamente) a. Se utilizará de nuevo 
la regla empírica n > 40 para caracterizar un tamaño de muestra grande. 

Ejemplo 8.8 


14.1 

14.5 

15.5 

16.0 

16.0 

16.7 

16.9 

17.1 

17.5 

17.8 

17.8 

18.1 

18.2 

18.3 

18.3 

19.0 

19.2 

19.4 

20.0 

20.0 

20.8 

20.8 

21.0 

21.5 

23.5 

27.5 

27.5 

28.0 

28.3 

30.0 

30.0 

31.6 

31.7 

31.7 

32.5 

33.5 

33.9 

35.0 

35.0 

35.0 

36.7 

40.0 

40.0 

41.3 

41.7 

47.5 

50.0 

51.0 

51.8 

54.4 


55.0 57.0 


Se utiliza un penetrómetro cónico dinámico (DCP, por sus siglas en inglés) para medir la re¬ 
sistencia de un material a la penetración (mm/golpe), a medida que el cono es insertado en 
pavimento o subrasante. Suponga que para una aplicación particular, se requiere que el va¬ 
lor penetración cónica dinámica promedio verdadera para un cierto tipo de pavimento sea 
menor que 30. El pavimento no será utilizado a menos que exista evidencia concluyente de 
que la especificación fue satisfecha. Formule y pruebe las hipótesis apropiadas utilizando 
los datos siguientes (“Probabilistic Model for the Analysis of Dynamic Cone Penetrometer 
Test Valúes in Pavement Structure Evaluation”, J. ofTesting and Evaluation, 1999: 7-14: 


2 = (-5.42) 2 = 29.32 


La figura 8.3 muestra un resumen descriptivo obtenido con MINITAB. La penetración có¬ 
nica dinámica media muestral es menor que 30. Sin embargo, existe una cantidad sustancial 
de variación en los datos (coeficiente de variación muestral = s/x = 0.4265), de modo que 
la media sea menor que el valor de corte de la especificación de diseño puede ser una con¬ 
secuencia simplemente de la variabilidad muestral. Obsérvese que el histograma no se ase¬ 
meja en absoluto a una curva normal (y una curva de probabilidad normal no exhibe un 
patrón lineal), aunque las pruebas z con muestras grandes no requieren una distribución de 
población normal. 
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Estadística descriptiva 



PENETRACIÓN DE 
CONO DINÁMICO VARIABLE 

Prueba de normalidad 
de Anderson-Darling 


A al cuadrado 

1.902 

Valor P 

0.000 

Media 

28.7615 

Desv. Estd. 

12.2647 

Varianza 

150.423 

Asimetría 

0.808264 

Kurtosis 

-3.9E-01 

N 

52 




Mínimo 
1er. cuardl 
Mediana 
3er. cuardl 
Máximo 


14.1000 

18.2250 

27.5000 

35.0000 

57.0000 


Intervalo de confianza de 95% para 
MU 25.3470 32.1761 

Intervalo de confianza de 95% para 
10.2784 15.2098 


sigma 


Intervalo de confianza de 95% para 
la mediana 


20.0000 


31.7000 


Figura 8.3 Resumen descriptivo generado por MINITAB para los datos de penetración de cono 
dinámico del ejemplo 8.8. 


1. ¡a = valor de penetración cónica dinámica promedio verdadero 

2. H 0 : ¡jl= 30 

3. H ñ :fi < 30 (por consiguiente el parámetro no será utilizado a menos que la hipótesis 
nula sea rechazada). 


x - 30 

4. z = - i=^ 

s/vñ 

5. Una prueba con nivel de significación de 0.05 rechaza a H 0 cuando z — —1.645 (una 
prueba de cola inferior). 

6. Con n = 52, x = 28.76 y s = 12.2647, 


28.76 - 30 -1.24 

12.2647/V52 ~~ 1.701 


7. Como —0.73 > —1.645, H 0 no puede ser rechazada. No se cuenta con evidencia preci¬ 
sa para concluir que ¡j, < 30; el uso del pavimento no se justifica. ■ 


La determinación de ¡5 y el tamaño de muestra necesario para estas pruebas con mues¬ 
tra grande pueden basarse en la especificación de un valor plausible de cr o en el uso de la 
formulación para el caso I (aun cuando se utilice s en la prueba) o en el uso de las curvas 
que se introducirán en breve en conexión con el caso III. 


Caso III: Una distribución de población normal 

Cuando n es pequeño, el teorema del límite central (TLC) ya no puede ser invocado para 
justificar el uso de una prueba con muestra grande. Esta misma dificultad se presenta al ob¬ 
tener un intervalo de confianza con muestra pequeña (IC) para ¡i en el capítulo 7. El método 
utilizado aquí es el mismo que el usado allí. Se supondrá que la distribución de población es 
por lo menos aproximadamente normal y se describirán los procedimientos de prueba cuya 
validez se fundamenta en esta suposición. 
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Si un investigador tiene una buena razón para creer que la distribución de población es bas¬ 
tante subnormal, se puede utilizar una prueba libre de distribución del capítulo 15. Alterna¬ 
tivamente, un estadístico puede ser consultado en cuanto a procedimientos válidos para 
familias específicas de distribuciones de población, aparte de la familia normal. O se puede 
desarrollar un procedimiento bootstrap. 

Se utilizó el resultado clave en el cual están basadas las pruebas con una media de po¬ 
blación normal en el capítulo 7 para derivar el intervalo de confianza t para una muestra: Si 
Xj, X 2 ... , X n es una muestra aleatoria de una distribución normal, la variable estandarizada 

T= *-/¿ 

S/Vn 

tiene una distribución t con n— 1 grados de libertad (gl). Considérese poner a prueba //„: p 
= ¡jíq contra /7, t : p > p 0 utilizando el estadístico de prueba T = (X — ijl i¡ )/(S/X / Ti). Es decir, 
el estadístico de prueba resulta de estandarizar X conforme a la suposición de que H 0 es ver¬ 
dadera (utilizando S/Vn, la desviación estándar estimada de X en lugar de cr/Vñ). Cuando 
H 0 es verdadera, el estadístico de prueba tiene una distribución t con n - 1 grados de liber¬ 
tad. El conocimiento de la distribución del estadístico de prueba cuando H 0 es verdadera (la 
“distribución nula”) permite construir una región de rechazo para la cual la probabilidad de 
error de tipo I se controla al nivel deseado. En particular, el uso del valor crítico t de cola 
superior t a n _ 1 para especificar la región de rechazo t > t a n _ , implica que 

/'(error de tipo I) = P(H 0 es rechazada cuando es verdadera) 

= P(T > t a „_j cuando T tiene una distribución t con n - 1 
grados de libertad) 

= a 

El estadístico de prueba es en realidad el mismo del caso de muestra grande pero se 
designa T para recalcar que distribución nula es una distribución 1 con n— 1 grados de liber¬ 
tad en lugar de la distribución estándar normal (z). La región de rechazo para la prueba / di¬ 
fiere de aquella para la prueba z sólo en que un valor crítico t a n _ ¡ reemplaza al valor crítico 
z a . Comentarios similares se aplican a alternativas para las cuales una prueba de cola infe¬ 
rior o de dos colas es apropiada. 


Prueba f con una muestra 
Hipótesis nula: H 0 : p = p 0 

Valor estadístico de prueba: t = 


Hipótesis alternativa 

Región de rechazo para una prueba de nivel a 

H d -. p > p 0 

t —t a , n - 1 (cola superior) 

H d \ p < p. 0 

t < —t a n _¡ (cola inferior) 

H d . p, A fi 0 

° t > t a , Xn _ x o t < t a / 2 ¡n —i (dos colas) 




Un entorno de trabajo bien diseñado y seguro puede contribuir en gran medida a incrementar 
la productividad. Es especialmente importante que a los trabajadores no se les pida realizar ta¬ 
reas, tales como izar cosas, que excedan sus capacidades. Los datos adjuntos sobre peso má¬ 
ximo de izamiento (MAWL, por sus siglas en inglés, en kg) para una frecuencia de cuatro 
izamientos/min fueron reportados en el artículo “The Effects of Speed, Frequency, and Load 
on Measured Hand Forces for a Floor-to-Knuckle Lifting Task” ( ErgonotJiics , 1992: 833-843); 
se seleccionaron al azar sujetos de una población de varones saludables de 18 a 30 años de 
edad. Suponiendo que el peso máximo de izamiento está normalmente distribuido ¿sugieren 
los datos siguientes que el peso máximo de izamiento medio de la población excede de 25? 

25.8 36.6 26.3 21.8 27.2 

Efectúe una prueba con un nivel de significación de 0.05. 
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1. ¡x = peso de izamiento máximo medio de la población 

2. H 0 : ¡x = 25 

3. tf a : /i >25 

x — 25 

4. t = - J=r- 

s/vn 

5. Rechazar H 0 si t > t a n _ í = í 005 4 = 2.132. 

6. Y,x¡ = 137.7 y Y.x 2 ¡ = 3911.97, con las cuales x = 27.54, s = 5.47, y 

27.54 - 25 2.54 

t = - -¡=- = - = 1.04 

5.47/V5 2.45 

Los datos de salida de MINITAB adjuntos resultado de una solicitud para una prueba t con 
una muestra son los mismos valores calculados (El valor P se discutió en la sección 8.4). 

Prueba de mu = 2 5. 0 0 vs mu > 2 5.0 0 

Variable N Media DesvEstand Media SE T Valor P 

Peso máximo de izamiento 5 27.54 5.47 2.45 1.04 0.18 

7. Como 1.04 no queda en la región de rechazo (1.04 < 2.132), H 0 no puede ser rechazada 
a un nivel de significación de 0.05. Aún es plausible que ¡x sea (cuando mucho) de 25. ■ 

¡3 y determinación del tamaño de muestra El cálculo de /3 con el valor alternativo /a' en 
el caso I se realizó expresando la región de rechazo en función de 3c (p. ej., x > ¡x 0 + z a ■ cr/Vñ) 
y luego restando /a' para estandarizar correctamente. Un método equivalente implica observar 
que cuando ¡x = /a', el estadístico de prueba Z = (X — ix 0 )/(cr/\^ñ) sigue teniendo una distri¬ 
bución normal con varianza 1, pero ahora el valor medio de Z es (/a' — ix Q )/(aPvn). Es decir, 
cuando ¡x = /a', el estadístico de prueba sigue teniendo una distribución normal pero no la dis¬ 
tribución normal estándar. Por eso, ¡3(¡x' ) es un área bajo la curva normal correspondiente al 
valor medio (/a' — ix 0 )/(a/vn) y varianza 1. Tanto a como ¡3 implican trabajar con varia¬ 
bles normalmente distribuidas. 

El cálculo de /3(/a') para prueba t es mucho menos directo. Esto es porque la distribu¬ 
ción del estadístico de prueba T = (X — ¡x 0 )/(¿’/Vñ) es bastante complicado cuando H 0 es 
falsa y H a es verdadera. Por consiguiente, en una prueba de cola superior, determinar 

|3(/a') = P(T < t a n _j cuando ¡x = ¡x' en lugar de /a 0 ) 

implica integrar una desagradable función de densidad. Esto debe hacerse numéricamente, 
pero por fortuna, ya fue realizado por estadísticos investigadores tanto para pruebas t de una 
cola como de dos colas. Los resultados se resumen en gráficas de ¡3 que aparecen en la ta¬ 
bla A. 17. Existen cuatro juegos de gráficas, correspondientes a pruebas de una cola a nivel 
0.05 y nivel 0.01 y pruebas de dos colas a los mismos niveles. 

Para entender cómo se utilizan estas gráficas, obsérvese primero que tanto [3 como el 
tamaño de muestra n en el caso I son función no sólo de la diferencia absoluta | /a 0 — /a' | 
sino de d = | ¡x 0 — ¡x' \ la. Supóngase, por ejemplo, que | /a 0 — /a' | = 10. Este alejamien¬ 
to de H 0 será mucho más fácil de descubrir ((3 más pequeña) cuando cr = 2, en cuyo caso 
¡Xq y ¡x' están a 5 desviaciones estándar de población una de otra, que cuando cr = 10. El 
hecho de que f3 para la prueba t dependa de d y no sólo de | ¡x 0 — ¡x' | es desafortunado, 
puesto que para utilizar las gráficas se debe tener alguna idea del valor verdadero de cr. Una 
suposición conservadora (grande) para cr dará por resultado un valor conservador (grande) 
de Í3(¡x') y una estimación conservadora del tamaño de muestra necesario para a y [3(/x') 
prescritas. 

Con la ¡x' alternativa y el valor de cr seleccionados, se calcula d y su valor se localiza 
sobre el eje horizontal del conjunto de curvas pertinente. El valor de ¡3 es la altura de la cur¬ 
va con n — 1 grados de libertad por encima del valor de d (es necesaria una interpolación 
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P 



Valor de d correspondiente a j± ' alternativa especificada 

Figura 8.4 Curva ¡3 típica de la prueba t. 


visual si n — 1 no es un valor para el cual la curva correspondiente aparece), como se ilus¬ 
tra en la figura 8.4. 

En lugar de fijar n (es decir, n - 1, y por consiguiente la curva particular en donde se 
lee ¡3) se podría prescribir tanto a (0.05 o 0.01 en este caso) y un valor de [3 para las ¡x' y a 
seleccionadas. Después de calcular d, se localiza el punto (d, (3) en el conjunto de gráficas 
pertinentes. La curva debajo y más próxima a este punto da n — 1 y por consiguiente n (de 
nuevo con frecuencia se requiere interpolación). 

Se supone que la caída de voltaje promedio verdadera entre el colector y el emisor de tran¬ 
sistores bipolares de compuerta aislados de un cierto tiempo es cuando mucho de 2.5 volts. 
Un investigador selecciona una muestra de n = 10 de esos transistores y utiliza los voltajes 
resultantes para probar H 0 : ¡x = 2.5 contra H¿. ¡x > 2.5 por medio de una prueba 1 con 
nivel de significación a = 0.0.5. Si la desviación estándar de la distribución de voltaje es 
cr = 0.100, ¿qué tan probable es que H 0 no será rechazada cuando en realidad ¡± = 2.6? Con 
d = | 2.5 — 2.6 | /0.100 = 1.0, el punto sobre la curva ¡3 con 9 grados de libertad para una 
prueba de una cola con a = 0.05 por encima de 1.0 tiene aproximadamente 0.1 de altura, 
por lo tanto f3 «0.1. El investigador podría pensar que este es un valor de /3 demasiado 
grande con semejante alejamiento sustancial de H 0 y puede que desee tener ¡3 = 0.05 con 
este valor alternativo de ¡x. Como d = 1.0, el punto (d, ¡3) = (1.0, 0.05) debe ser localiza¬ 
do. Este punto se aproxima mucho a la curva de 14 grados de libertad, por lo tanto con n = 
15 se obtendrá tanto a = 0.05 como [3 = 0.05 cuando el valor de ¡x es 2.6 y cr = 0.10. Un 
valor más grande de cr daría una ¡3 más grande para esta alternativa y un valor alternativo de 
¡x más cercano a 2.5 también daría por resultado un valor incrementado de [3. ■ 

La mayoría de los programas de computadora estadísticos también calcularán probabi¬ 
lidades de error de tipo II y determinarán tamaños de muestra necesarios. Como un ejemplo, 
se le pide a MINITAB que realice los cálculos del ejemplo 8.10. Sus cálculos están basados 
en la potencia, la cual es simplemente 1 — ¡3. Se desea que ¡3 sea pequeña, lo cual equivale 
a solicitar que la potencia de la prueba sea grande. Por ejemplo, ¡3 = 0.05 corresponde a un 
valor de 0.95 de potencia. Los datos de salida de MINITAB se dan a continuación. 

Power and Sample Size 

Testing mean=nuil (versus>nuil) 

Calculating power for mean = nuil +0.1 
Alpha = 0.05 Sigma = 0.1 

Sample 

Size Power 

10 0.8975 
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Power and Sample Slze 

1-Sample t Test 

Testing mean = nuil (versus> nuil) 

Calculating power for mean = nuil +0.1 
Alpha = 0.05 Sigma =0.1 

Sample Target Actual 

Size Power Power 

13 0.9500 0.9597 

Obsérvese en la segunda parte de los datos de salida que el tamaño de muestra necesario para 
obtener una potencia de 0.95 (J3 = 0.05) para una pmeba de cola superior con a = 0.05 cuando 
cr = 0.1 y ¡x es 0.1 más grande que ¡x 0 es de sólo n = 13, mientras que las curvas [3 dieron 15. 
Cuando está disponible, este tipo de software es más confiable que las curvas. 


EJERCICIOS Sección 8.2 (15-34) 


15. Sea el estadístico de pmeba Z con una distribución normal 
estándar cuando H 0 es verdadera. Dé el nivel de significa¬ 
ción en cada una de las siguientes situaciones: 

a. H- p > ¡jl 0 , región de rechazo z — 1.88 

b. H- p < ¡x 0 , región de rechazo z — — 2.75 

c. í/ a : ¡x # p 0 , región de rechazo z — 2.88 o z £ -2.88 

16. Sea el estadístico de prueba T con una distribución t cuan¬ 
do H 0 es verdadera. Dé el nivel de significación en cada una 
de las situaciones: 

a. H- ¡x > /t 0 , grados de libertad =15, región de rechazo 
f > 3.733 

b. // a : p, < p 0 , n = 24, región de rechazo t £ -2.500 

c. // a : p A p 0 , n =31, región de rechazo (S 1.697 o 
f < -1.697 

17. Responda las siguientes preguntas en relación con el pro¬ 
blema de las llantas en el ejemplo 8.7. 

a. Si x = 30 960 y se utiliza una pmeba de nivel a = 0.01, 
¿cuál es la decisión? 

b. Si utiliza una pmeba de nivel 0.01, ¿cuál es /3(30 500)? 

c. Si se utiliza una pmeba de nivel 0.01 y también se re¬ 
quiere /3(30 500), ¿cuál es la a más pequeña con la cual 
H 0 puede ser rechazada (con base en n = 16)? 

18. Reconsidere la situación de secado de pintura del ejemplo 
8.2, en el cual el tiempo de secado para un espécimen de 
pmeba está normalmente distribuido con cr = 9. Las hipó¬ 
tesis H a \ p = 75 contra H¿. p < 75 tienen que ser probadas 
con una muestra aleatoria de n = 25 observaciones. 

a. ¿A cuántas desviaciones estándar (de X ) por debajo del 
valor nulo se encuentra x = 72.3? 

b. Si x = 72.3, ¿cuál es la conclusión si utiliza a = 0.01? 

c. ¿Cuál es a para el procedimiento de pmeba que rechaza 
H 0 , cuando z ^ —2.88? 

d. Con el procedimiento de prueba de la parte (c), ¿cuál es 

13(10)1 

e. Si se utiliza el procedimiento de prueba (c), ¿qué tamaño 
de muestra n es necesario para garantizar ¡3(10) = 0.01? 

f. Si se utiliza un prueba de nivel 0.01 con n = 100, ¿cuál 
es la probabilidad de un error de tipo I cuando p = 76? 

19. Se determinó el punto de fusión de cada una de las 16 
muestras de una cierta marca de aceite vegetal hidrogenado 


y el resultado fue x = 94.32. Suponiendo que la distribu¬ 
ción del punto de fusión es normal con <x = 1.20. 

a. Probar H 0 \ p = 95 contra p A 95 por medio de una 
prueba de dos colas de nivel 0.01. 

b. Si se utiliza una prueba de nivel 0.01, ¿cuál es ¡3( 94), la 
probabilidad de un error de tipo II cuando p = 94? 

c. ¿Qué valor de n es necesario para garantizar que ¡3( 94) 
= 0.1 cuando a = 0.01? 

20. Se anuncia que focos de un cierto tipo duran un promedio 
de 750 horas. El precio de estos focos es muy favorable por 
lo que un cliente potencial ha decidido continuar con un 
convenio de compra hasta que concluyentemente se de¬ 
muestre que la duración promedio verdadera es menor que 
la anunciada. Se seleccionó una muestra de 50 focos, se de¬ 
terminó la duración de cada uno y se probaron las hipótesis 
apropiadas con MINITAB y se obtuvieron los siguientes re¬ 
sultados adjuntos. 

Variable N Mean StDev SEMean ZP-Value 

lifetime 50 738.44 38.20 5.40-2.14 0.016 

¿Qué conclusión sería apropiada para un nivel de significa¬ 
ción de 0.05? ¿Un nivel de significación de 0.01? ¿Qué ni¬ 
vel de significación y conclusión recomendaría? 

21. Se supone que el diámetro promedio verdadero de cojine¬ 
tes de bolas de un cierto tipo es de 0.5 pulg. Se realizará 
una prueba t con una muestra para ver si este es el caso. 
¿Qué conclusión es apropiada en cada una de las siguien¬ 
tes situaciones? 

a. n = 13, t = 1.6, a = 0.05 

b. n = 13, t = -1.6, a = 0.05 

c. n = 25, t = -2.6, a = 0.01 

d. n = 25, t = -3.9 

22. El artículo “The Foreman's View of Quality Control” (Qua- 
lity Engr. 1990: 257-280) describe una investigación de pe¬ 
sos de recubrimiento de grandes tuberías resultantes de un 
proceso de galvanizado. Los estándares de producción de¬ 
mandan un peso promedio verdadero de 200 Ib por tubería. 
El resumen y diagrama de caja descriptivos adjuntos fueron 
producidos por MINITAB. 
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Variable 
ctg wt 

Variable 
ctg wt 


N Mean Median TrMean 
30 206.73 206.00 206.81 

Min Max Q1 

193.00 218.00 202.75 


StDev SEMean 
6.35 1.16 

Q3 

212.00 


— j - j - j - 1 -Peso de recubrimiento 

190 200 210 220 

a. ¿Qué sugiere el diagrama de caja sobre el estado de la 
especificación de peso de recubrimiento promedio? 

b. Una gráfica de probabilidad normal de los datos resultó 
bastante recta. Use los datos de salida descriptivos para 
probar las hipótesis apropiadas. 

23. El ejercicio 36 del capítulo 1 dio n = 26 observaciones sobre 
tiempo de escape (seg) de trabajadores petroleros en un ejer¬ 
cicio simulado, con media y desviación estándar muéstrales 
de 370.69 y 24.36, respectivamente. Suponga que los inves¬ 
tigadores creyeron de antemano que el tiempo de escape pro¬ 
medio verdadero sería cuando mucho de 6 min. ¿Contradicen 
los datos esta creencia anticipada? Suponiendo normalidad, 
pruebe las hipótesis apropiadas mediante un nivel de signifi¬ 
cación de 0.05. 

24. Reconsidere las observaciones muéstrales sobre viscosidad 
estabilizada de especímenes de asfalto introducidos en el 
ejercicio 46 del capítulo 1 (2781, 2900, 3013, 2856 y 2888). 
Suponga que para una aplicación particular, se requiere que 
la viscosidad promedio verdadera sea de 3000. ¿Parece ha¬ 
ber sido satisfecho este requerimiento? Formule y pruebe 
las hipótesis apropiadas. 

25. El porcentaje deseado de SiCf, en un cierto tipo de cemento 
aluminoso es de 5.5. Para comprobar si el porcentaje prome¬ 
dio verdadero es de 5.5 en una instalación de producción par¬ 
ticular, se analizaron 16 muestras independientemente 
obtenidas. Suponga que el porcentaje de Si0 2 en una mues¬ 
tra está normalmente distribuido con <x = 0.3 y que x = 5.25. 

a. ¿Indica esto concluyentemente que el porcentaje prome¬ 
dio verdadero difiere de 5.5? Realice el análisis siguien¬ 
do la secuencia de pasos sugerida en el texto. 

b. Si el porcentaje promedio verdadero es /x = 5.6 y se uti¬ 
liza una prueba de nivel a = 0.01 con n = 16, ¿cuál es 
la probabilidad de descubrir este alejamiento de Hf! 

c. ¿Qué valor de n se requiere para satisfacer a = 0.01 y 
j8(5.6) = 0.01? 

26. Para obtener información sobre las propiedades de resisten¬ 
cia a la corrosión de un cierto tipo de tubo de acero, se en¬ 
terraron 45 especímenes en el suelo durante un periodo de 
2 años. Se midió entonces la penetración máxima (en mils) 
en cada espécimen y se obtuvo una penetración promedio 
muestral de x = 52.7 y una desviación estándar muestral 
de í = 4.8. Los tubos se fabricaron con la especifica¬ 
ción de que la penetración promedio verdadera sea cuando 
mucho de 50 mils. Se utilizarán a menos que se pueda de¬ 
mostrar concluyentemente que la especificación no ha sido 
satisfecha. ¿Qué concluiría? 
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27. La identificación automática de los límites de estructuras 
significativas en una imagen médica es un área de investi¬ 
gación continua. El artículo “Automatic Segmentation of 
Medical Images Using Image Registration: Diagnostic and 
Simulation Applications” (7. of Medical Engr. and Tech., 
2005: 53-63) discutió una nueva técnica, realizar la identifi¬ 
cación mencionada. Una medida de la precisión de la región 
automática es el desplazamiento lineal promedio (ALD, por 
sus siglas en inglés). El artículo dio las siguientes observa¬ 
ciones de desplazamiento lineal promedio con una muestra 
de 49 riñones (unidades de dimensiones en pixeles). 
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a. Resuma y describa los datos. 

b. ¿Es plausible que el desplazamiento lineal promedio es¬ 
té por lo menos normalmente distribuido? ¿Se debe su¬ 
poner normalidad antes de calcular un intervalo de 
confianza para el desplazamiento lineal promedio verda¬ 
dero o probar las hipótesis en cuanto a desplazamiento 
lineal promedio? Explique. 

c. Los autores comentaron que en la mayoría de los casos 
el desplazamiento lineal promedio es mejor que o del or¬ 
den de LO. ¿Proporcionan en realidad los datos una 
fuerte evidencia para concluir que el desplazamiento li¬ 
neal promedio en estas circunstancias es menor que 1.0? 
Efectúe una prueba apropiada de hipótesis. 

d. Calcule un límite de confianza superior para el despla¬ 
zamiento lineal promedio utilizando un nivel de confian¬ 
za de 95% e interprete este límite. 

28. La cirugía menor de caballos en condiciones de campo re¬ 
quiere un anestésico de corta duración confiable que produz¬ 
ca una buena relajación muscular, cambios cardiovasculares 
y respiratorios mínimos y una rápida y tranquila recuperación 
con un mínimo de efectos secundarios de modo que los caba¬ 
llos puedan ser dejados sin atención. El artículo “A Field Trial 
of Ketamine Anestesia in the Horse” (Equine Vet. J., 1984: 
176-179) reporta que con una muestra de n = 73 caballos a 
los cuales se les administró ketamina en ciertas condiciones, 
el tiempo de reclinación lateral (echado) promedio muestral 
fue de 18.86 min y la desviación estándar de 8.6 min. ¿Sugie¬ 
ren estos datos que el tiempo de reclinación lateral promedio 
verdadera en estas condiciones es menor que 20 min? Pruebe 
las hipótesis apropiadas a un nivel de significación de 0.10. 

29. Se determinó la cantidad de desgaste en una flecha (0.0001 
pulg) después de un kilometraje fijo para cada uno de n — 8 
motores de combustión interna con cojinetes de plomo al 
cobre y se obtuvo x = 3.72 y s = 1.25. 

a. Suponiendo que la distribución del desgaste de la flecha 
es normal con media ¿i, use la prueba a un nivel de 0.05 
para probar H 0 : /x = 3.50 contra H a : /x > 3.50. 

b. Con cr = 1.25, ¿cuál es la probabilidad de error de tipo 
II /3(/x , ) de la prueba con la ¿x'= 4.00 alternativa? 

30. La ración dietética diaria recomendada de zinc entre varones de 
más de 50 años es de 15 mg/día. El artículo “Nutrient Intakes 
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and Dietary Pattems of Older Americans: A National Study” 
(J. Gerontology, 1992: M145-150) reporta los siguientes datos 
de ingesta con una muestra de varones de 65-74 años, n— 115, 
x = 11.3 y s = 6.43. ¿Indican estos datos que la ingesta de zinc 
diaria promedio en la población de todos los varones de 65-74 
años queda por debajo de la ración recomendada? 

31. En un experimento diseñado para medir el tiempo necesario 
para que los ojos de un inspector se acostumbren a la canti¬ 
dad de luz reducida para una inspección penetrante, el tiem¬ 
po promedio muestral para n = 9 inspectores fue de 6.32 seg 
y la desviación estándar muestral fue de 1.65 seg. Previamen¬ 
te se supuso que el tiempo de adaptación promedio fue por lo 
menos de 7 seg. Suponiendo que el tiempo de adaptación es¬ 
tá normalmente distribuido, ¿contradicen los datos la creen¬ 
cia anticipada? Use la prueba t con a — 0.1. 

32. Se seleccionó una muestra de 12 detectores de radón de un 
cierto tipo y cada uno se expuso a 100 pCi/1 de radón. Las 
lecturas resultantes fueron las siguientes: 


105.6 90.9 91.2 96.9 96.5 91.3 

100.1 105.0 99.6 107.7 103.3 92.4 

a. ¿Sugieren estos datos que la lectura media de la pobla¬ 
ción en estas condiciones difieren de 100? Formule y 
pruebe las hipótesis apropiadas con a = 0.05. 

b. Suponga que antes del experimento, se supuso un va¬ 
lor de cr = 7.5. ¿Cuántas determinaciones tendrían que 
ser apropiadas para obtener /3 = 0.10 con la alternativa 
p, = 95 ? 

33. Demuestre que con cualquier A > 0, cuando la distribución 
de la población es normal y <x conocida, la prueba de dos 
colas satisface jS(/x 0 — A) = /3(p 0 + A), de modo que /3(p/) 
sea simétrica con respecto a ¡jl 0 . 

34. Para un valor pf alternativo fijo, demuestre que /3(p/) — » 0 
a medida que n —* °° con una prueba z de una cola o de dos 
colas en el caso de una distribución de población normal 
con a conocida. 


8.3 Pruebas relacionadas con una proporción de población 



Sea p la proporción de individuos u objetos en una población que poseen una propiedad es¬ 
pecial (p. ej., carros con transmisión manual o fumadores que fuman cigarrillos con ñtro). Si 
un individuo u objeto con la propiedad es etiquetado como éxito ( E ), entonces p es la propor¬ 
ción de población de éxitos. Las pruebas relacionadas con p se basarán en una muestra alea¬ 
toria de tamaño n de la población. Siempre que n sea pequeño con respecto al tamaño de la 
población, X (el número de éxitos en la muestra) tiene (aproximadamente) una distribución 
binomial. Además, si n es grande, tanto X como el estimador p = X/n están normalmente dis¬ 
tribuidos. Primero se consideran pruebas con muestras grandes basadas en este último hecho 
y luego se acude al caso de muestra pequeña que usa directamente la distribución binomial. 


Pruebas con muestra grande 


Las pruebas con muestra grande relacionadas con p son un caso especial de los procedimientos 
con muestra grande para un parámetro 0. Sea 9 un estimador de 9 que es (por lo menos aproxi¬ 
madamente) insesgado y que tiene aproximadamente una distribución normal. La hipótesis nu¬ 
la tiene la forma H 0 :9 = 9 0 , donde 9 0 denota un número (el valor nulo) apropiado al contexto del 
problema. Suponga que cuando H 0 es verdadero, la desviación estándar de 9, cr§, no implica pa¬ 
rámetros desconocidos. Por ejemplo, si 9 = p. y 9 = X, cr ¿ = crj = cr/Vn, la cual no implica 
parámetros sólo si se conoce el valor de cr. Al estandarizar 9 conforme a la suposición de que H 0 
es verdadera (de modo que E(9) = 9 0 se obtiene un estadístico de prueba con muestra grande): 


Estadístico de prueba: 


Z = 


tlJsL 


«■fl 

Si la hipótesis alternativa es H d : 9 > 9 0 , la región de rechazo z > z a especifica una prueba de 
cola superior cuyo nivel de significancia es aproximadamente a. Las otras dos alternativas, 
H- 9 < 9 0 y H d : 9 A 9 0 , se someten a prueba z de cola inferior y a una prueba z de dos co¬ 
las, respectivamente. 

En el caso 9 = p,a~ s no implicará parámetros desconocidos cuando H 0 es verdadera, 
aunque esto es atípico. Cuando cr¿ no implica parámetros desconocidos, a menudo es posi¬ 
ble utilizar una desviación estándar estimada S 0 en lugar de cr¿ y seguir teniendo Z aproxi¬ 
madamente normalmente distribuida cuando H 0 es verdadera (porque n es grande cuando 
s§ ~ cr¿ con la mayoría de las muestras). La prueba con muestra grande de la sección previa 
da un ejemplo de esto porque cr casi siempre es desconocida, se utiliza = s]¿ = s/Vn en 
lugar de cr/Vñ en el denominador de z. 
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El estimador p = X/n es (E(p) = p), insesgado y su distribución es aproximadamen¬ 
te normal y su desviación estándar es cr■- = V/?( 1 — p)/n. Estos hechos se utilizaron en la 
sección 7.2 para obtener un intervalo de confianza para p. Cuando H 0 es verdadera E(p) = 
Po Y a p = v/;„( I — p 0 )/n, así que cr- no implica parámetros desconocidos. Se desprende en¬ 
tonces que cuando n es grande y H 0 es verdadera, el estadístico de prueba 

z P~Po 
Vp 0 ( 1 ~ p 0 )ln 

tiene aproximadamente una distribución normal estándar. Si la hipótesis alternativa es H d : 
P > Ai Y se utiliza la región de rechazo de cola superior z & z a , entonces 

Eferror de tipo I) = P(H 0 es rechazada cuando es verdadera) 

= P(Z > z a cuando Z tiene aproximadamente una distribución 
normal estándar) ~ a 

Por consiguiente el nivel de significación deseado a se obtiene utilizando el valor crítico que 
capture área crítica a en la cola superior de la curva z. Las regiones de rechazo para las otras 
dos hipótesis alternativas, cola inferior para H d : p < p 0 y dos colas para f/ a : p A p 0 se justi¬ 
fica de manera análoga. 


Hipótesis nula: H 0 : p = p 0 


Valor estadístico de prueba: 

P~ Po 

Z V/? 0 ( 1 - p 0 )/n 

Hipótesis alternativa 

Región de rechazo 

V 

^3 

o 

Z s z a (cola superior) 

P < Po 

z — ~z a (cola inferior) 

H. d : P+Po 

o z — z a ,2 o z — ~z a/ 2 (dos colas) 


Estos procedimientos de prueba son válidos siempre que np 0 > 10 y n(l - p 0 ) >10. 



Información reciente sugiere que la obesidad es un problema creciente en Estados Unidos 
entre grupos de todas las edades. La Prensa Asociada (9 de octubre de 2002) reportó que 
1276 individuos en una muestra de 4115 adultos fueron encontrados obesos (un índice de 
masa corporal de más de 30; este índice mide el peso con respecto a la estatura). Una en¬ 
cuesta realizada en 1998 basada en la autoevaluación de las personas reveló que el 20% de 
los estadounidenses adultos se autoconsideraron obesos. ¿Sugieren los datos más recientes 
que la proporción verdadera de adultos obesos es más de 1.5 veces el porcentaje de la en¬ 
cuesta de autoevaluación? Realice una prueba de hipótesis utilizando un nivel de significa¬ 
ción de 0.10. 

1. p = la proporción de todos los adultos estadounidenses obesos. 

2. Decir que el porcentaje actual es 1.5 veces el porcentaje de autoevaluación equivale a 
aseverar que el porcentaje actual es de 30%, de donde se deduce la hipótesis nula como 
H 0 : p = 0.30. 

3. La frase “más que” en la descripción del problema implica que la hipótesis alternativa 
es H d . p > 0.30. 

4. Como np 0 = 4115(0.3) > 10 y nq 0 = 4115(0.7) > 10, ciertamente la prueba con mues¬ 
tra grande puede ser utilizada. El valor estadístico de prueba es 


z = (p~ 0.3)/V(0.3)(0.7 )/n 
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5. La forma de // a implica que una prueba de cola superior es apropiada: rechazar H 0 si 

z - > ¿o.io — 1-28. 

6. p = 1276/4115 = 0.310, de donde se obtiene z = (0.310 - 0.3)/V(0.3)(0.7)/4115 = 
0.010/0.0071 = 1.40. 

7. Como 1.40 excede el valor crítico 1.28, z queda en la región de rechazo. Esto justifica 

el rechazo de la hipótesis nula. Con un nivel de significación de 0.10 parece que más del 
30% de los estadounidenses son obesos. ■ 

P y determinación de tamaño de muestra Cuando H 0 es verdadera, el estadístico de prue¬ 
ba Z tiene aproximadamente una distribución normal estándar. Supóngase ahora que H 0 no 
es verdadera y que p = p' . Entonces Z sigue teniendo aproximadamente una distribución 
normal (porque es una función lineal de p), pero su valor medio y varianza ya no son 0 ni 
1, respectivamente. En su lugar, 

P' ~ Po P'( 1 ~ P'V» 

£( z ) = Vp Q ( 1 - p 0 )/n V (Z) = p Q (\ ~ p 0 )/n 

La probabilidad de un error de tipo II con una prueba de cola superior es ¡3(p') = [i con un 
valor especificado de /?, esta ecuación se resuelve para el tamaño de muestra n como en la 
sección 8.2. En el recuadro adjunto se dan expresiones generales para ¡5(p') y n. 



Hipótesis alternativa 


p>p 0 

$ 

p<Po 

i - d> 

P ^ Po 

$ 


-<b 


(S(P') 

Po ~ P' + Z a Vp 0 (l ~ p 0 )/n 

V//(l — p')/n 

Po - P' ~ Z a VPo(l ~ PoV» 

Vp'(l — p')/n 

Po ~ P' + Z al 2 Vp 0 (l ~ p 0 )/n 

Vp'( 1 — p')/n 

Po ~ P' ~ Z an Vp 0 (l ~ p 0 )/n 

Vp'( 1 — p')/n 


El tamaño de muestra n con el cual la prueba de nivel a también satisface (3(p') 
es 

' ~ z tt Vp 0 (l ~ Po) + Vp'(l ~ P) 

y p’ - Po 

r z a/2 Vpo(l - Po) + z B Vp’ P ) I 2 prueba de dos colas (una 
p' — p 0 solución aproximada) 


2 

prueba de una cola 


|8 



Ejemplo 8.12 Un servicio de mensajería anuncia que por lo menos el 90% de todos los paquetes llevados 
a su oficina alrededor de las 9 a.m. para entrega en la misma ciudad son entregados alrede¬ 
dor del mediodía de ese mismo día. Sea p la proporción verdadera de dichos paquetes que 
son entregados como se anuncia y considere las hipótesis H 0 : p = 0.9 contra //,/ p < 0.9. 
Si sólo el 80% de los paquetes son entregados como se anuncia, ¿qué tan probable es que 
una prueba de nivel 0.01 basada en n = 225 paquetes detectará tal alejamiento de //„? ¿Cuál 
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debe ser el tamaño de muestra para garantizar que yS(0.8) = 0.01? Con a = 0.01, p 0 = 0.9, 
p' = 0.8 y n = 225, 


¡3(0.8) = 1 - $| 


0.9 - 0.8 - 2.33V(0.9)(0.1)/225 \ 
V(0.8)(0.2)/225 ) 

= 1 - $(2.00) = 0.0228 


Así pues la probabilidad de que H 0 sea rechazada si se realiza la prueba cuando p = 0.8 es 
0.9772, aproximadamente el 98% de todas las muestras darán por resultado el rechazo co¬ 
rrecto de H 0 . 

Con z a = Zp = 2.33 en la fórmula del tamaño de muestra se obtiene 

= i 2.33V(0.9)(0.1) + 2.33\/(0.8)(0.2) 

L 0.8 - 0.9 



Pruebas con muestra pequeña 

Los procedimientos de prueba cuando el tamaño de muestra n es pequeño están basados di¬ 
rectamente en la distribución binomial en lugar de la aproximación normal. Considérese la 
hipótesis H a : p > p 0 y de nuevo sea X el número de éxitos en la muestra. Entonces X es el 
estadístico de prueba y la región de rechazo de cola superior tiene la forma x £ c. Cuando 
H 0 es verdadera, X tiene una distribución binomial con parámetros n y p 0 , por lo tanto 

/"(error de tipo I) = P(H 0 es rechazada cuando es verdadera) 

= P(X > c cuando X ~ Bin(«, p 0 )) 

= 1 - P(X < c — 1 cuando X ~ Bin(n, p 0 )) 

= 1 - B(c - 1; n, p 0 ) 

A medida que el valor crítico c disminuye, más valores x están incluidos en la región de re¬ 
chazo y /"(error de tipo I) se incrementa. Como X tiene una distribución de probabilidad dis¬ 
creta, casi nunca es posible hallar un valor de c con el cual /"(error de tipo I) sea exactamente 
el nivel de significación a deseado (p. ej., 0.05 o 0.01). En su lugar, se utiliza la región de 
rechazo más grande de la forma ¡c, c + 1 ,,n) que satisface 1 - B(c — 1; n, p 0 ) < a. 

Sea p' un valor alternativo de p(p' > p 0 ). Cuando p = p ', X ~ Biní/i, //), 
por lo tanto 

¡3(p') = /-"(error de tipo II cuando p = p') 

= P(X < c cuando X ~ Bin(n, p')) = B(c — 1; n, p') 

Es decir, /?(//) es el resultado de un cálculo de probabilidad binomial directo. El tamaño de 
muestra n necesario para garantizar que una prueba de nivel a tiene una ¡3 especificada con 
valor alternativo particular p' debe ser determinado mediante ensayo y error utilizando la 
función de distribución acumulativa binomial. 

Los procedimientos de prueba para // a : p < p 0 y para Z/ a : p / p {] se construyen de ma¬ 
nera similar. En el primer caso, la región de rechazo apropiada tiene la forma x < c (una 
prueba de cola inferior). El valor crítico c es el número más grande que satisface B(c; n, p 0 ) 
< a. La región de rechazo cuando la hipótesis alternativa es H d : p + p (í se compone tanto 
de valores x grandes como pequeños. 

Un fabricante de plástico desarrolló un nuevo tipo de bote de plástico para la basura y propo¬ 
ne venderlo con una garantía incondicional de seis años. Para ver si esto es económicamente 
factible, 20 botes prototipo se someten a una prueba acelerada de duración para simular seis 
años de uso. La garantía propuesta se modificará sólo si los datos muéstrales sugieren fuerte¬ 
mente que menos de 90% de los botes sobrevivirían el periodo de seis años. Sea p la propor¬ 
ción de todos los botes que sobreviven la prueba acelerada. Las hipótesis pertinentes son H 0 : 
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p = 0.9 contra H d : p < 0.9. La decisión se basará en el estadístico de prueba X, el número de 
entre los 20 que sobreviven. Si el nivel de significación es a = 0.05, c debe satisfacer 5(c; 
20, 0.9) < 0.05. De acuerdo con la tabla A. 1, 5(15; 20, 0.9) = 0.043, mientras que 5(16; 20, 
0.9) = 0.133. La región de rechazo apropiada es por consiguiente x < 15. Si la prueba ace¬ 
lerada da por resultado x = 14 , H 0 sería rechazada a favor de H d y se modificaría la garantía 
propuesta. La probabilidad de un error de tipo II con el valor alternativo p' = 0.8 es 

/3(0.8) = P(H 0 no es rechazada cuando X ~ Bin(20, 0.8)) 

= P{X >16 cuando X ~ Bin(20, 0.8)) 

= 1-5(15; 20, 0.8) = 1 - 0.370 = 0.630 

Es decir, cuando p = 0.8, el 63% de todas las muestras compuestas de n = 20 botes darían 
por resultado que H 0 no sea incorrectamente rechazada. Esta probabilidad de error es alta por¬ 
que 20 es un tamaño de muestra pequeño y p' = 0.8 se acerca al valor nulo p 0 = 0.9. ■ 


EJERCICIOS Sección 8.3 (35-44) 


35 . Los registros estatales de verificación de emisiones indican 
que de todos los vehículos verificados durante el año ante¬ 
rior, el 70% pasaron en el primer intento. Una muestra de 
200 carros probados en un condado particular durante el 
año en curso da 124 que pasaron en la prueba inicial. ¿Su¬ 
giere esto que la proporción verdadera en este condado du¬ 
rante el año en curso difiere de la proporción a nivel estatal 
previa? Pruebe las hipótesis pertinentes con a = 0.05. 

36 . Un fabricante de baterías de níquel-hidrógeno selecciona al 
azar 100 placas de níquel para probar las celdas, someterlas a 
ciclos un número especificado de veces y concluye que 14 de 
ellas se ampollan. 

a. ¿Proporciona esto una evidencia precisa para concluir 
que más de 10% de todas las placas se ampollan en ta¬ 
les circunstancias? Formule y pruebe las hipótesis apro¬ 
piadas con un nivel de significación de 0.05. Al llegar a 
su conclusión, ¿qué tipo de error pudo haber cometido? 

b. Si es realmente el caso de que el 15% de todas las placas 
se ampollan en estas circunstancias y se utiliza un tama¬ 
ño de muestra de 100, ¿qué tan probable es que la hipó¬ 
tesis nula de la parte (a) no sea rechazada por la prueba 
de nivel 0.05? Responda esta pregunta para un tamaño de 
muestra de 200. 

c. ¿Cuántas placas tendrían que ser probadas para tener 
j8(0.15) = 0.10 para la prueba de la parte (a)? 

37 . Una muestra aleatoria de 150 donaciones recientes en un 
cierto banco de sangre revela que 82 fueron de sangre tipo 
A. ¿Sugiere esto que el porcentaje de donaciones tipo A di¬ 
fiere de 40%, el porcentaje de la población que tiene sangre 
tipo A? Realice una prueba de las hipótesis apropiadas uti¬ 
lizando un nivel de significación de 0.01. ¿Habría sido dife¬ 
rente su conclusión si se hubiera utilizado un nivel de 
significación de 0.05? 

38 . Se sabe que aproximadamente 2/3 de todos los seres huma¬ 
nos tienen un ojo o pie derecho dominante. ¿Existe también 
dominio del lado derecho en el acto de besar? El artículo 41 . 
“Human Behavior: Adult Persistence of Head-Turning 
Asymmetry” ( Nature, 2003: 771) reportó que en una mues¬ 
tra aleatoria de 124 parejas que se besan, ambas personas en 


80 de las parejas tendieron a inclinarse más hacia la dere¬ 
cha que hacia la izquierda. 

a. Si 2/3 de las parejas que se besan exhiben esta tendencia 
de inclinarse hacia la derecha, ¿cuál es la probabilidad de 
que el número en una muestra de 124 que lo hacen así di¬ 
fiera del valor esperado en por lo menos lo que en reali¬ 
dad se observó? 

b. ¿Sugiere este resultado del experimento que la cifra de 
2/3 poco plausible como comportamiento al besarse? 
Formule y pruebe las hipótesis apropiadas. 

Una biblioteca de una universidad realiza un inventario gene¬ 
ral una vez al año. Debido a las nuevas reglas de colocación 
en los estantes instituidos el año anterior, el jefe bibliotecario 
cree que puede ser posible ahorrar dinero si pospone el inven¬ 
tario. El bibliotecario decide seleccionar al azar 1000 libros de 
la colección de la biblioteca y hacer que los localicen de una 
manera preliminar. Si la evidencia indica fuertemente que la 
proporción verdadera de libros mal colocados o ilocalizables 
es menor que 0.02, entonces el inventario se pospondrá. 

a. Entre los 1000 libros buscados, 15 estaban mal coloca¬ 
dos o ilocalizables. Pruebe las hipótesis pertinentes y 
aconseje al bibliotecario qué hacer (use a = 0.05). 

b. Si la proporción verdadera de libros mal colocados o 
perdidos es en realidad de 0.01, ¿cuál es la probabilidad 
de que el inventario se realice (innecesariamente)? 

c. Si la proporción verdadera es de 0.05, ¿cuál es la proba¬ 
bilidad de que el inventario se posponga? 
artículo “Statistical Evidence of Discrimination” ( J. 

Amer. Stat. Assoc., 1982: 773-783) discute el caso judicial 
Swain v. Alabanza (1965), en el cual se alegó que existió dis¬ 
criminación en la selección del gran jurado. Datos censuales 
sugirieron que el 25% de los eligióles para servir en el gran 
jurado eran negros, no obstante una muestra aleatoria de 
1050 llamados para servir posiblemente en el jurado sólo 
arrojó 177 negros. Con una prueba de nivel 0.01, ¿apoyan 
fuertemente estos datos la conclusión de discriminación? 
Una aerolínea desarrolló un club de viajeros ejecutivos so¬ 
bre la premisa de que el 5% de sus clientes actuales califi¬ 
carían para membresía. Una muestra aleatoria de 500 
clientes arrojó 40 que calificarían. 


40 . El 
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a. Con estos datos, pruebe a un nivel de 0.01 la hipótesis 
nula de que la premisa de la compañía es correcta con¬ 
tra la alternativa de que no es correcta. 

b. ¿Cuál es la probabilidad de que cuando se utiliza la 
prueba de la parte (a), la premisa de la compañía será 
juzgada correcta cuando en realidad el 10% de todos los 
clientes actuales califican? 

42 . Cada uno de un grupo de 20 tenistas intermedios recibe dos 
raquetas, una con cuerdas de nylon y la otra con cuerdas de 
tripa sintética. Tras de varias semanas de jugar con las dos 
raquetas, a cada jugador se le pide que manifieste una pre¬ 
ferencia por uno de los dos tipos de cuerdas. Sea p la pro¬ 
porción de todos los jugadores que preferirían las de tripa a 
las de nylon y sea X el número de jugadores en la muestra 
que prefieren las de tripa. Como las cuerdas de tripa son 
más caras, considere la hipótesis nula de que cuando mucho 
el 50% de todos los jugadores prefieren las cuerdas de tri¬ 
pa. Se simplifica esto a H a : p = 0.5, planificando rechazar 
H 0 sólo si la evidencia muestral favorece fuertemente las 
cuerdas de tripa. 

a. ¿Cuáles de las regiones de rechazo {15, 16, 17, 18, 19, 
20), {0, 1, 2, 3, 4, 5} o {0, 1, 2, 3, 17, 18, 19, 20} es más 
apropiada y por qué las otras dos no son apropiadas? 

b. ¿Cuál es la probabilidad de un error de tipo I para la región 
seleccionada de la parte (a)? ¿Especifica la región una 
prueba de nivel 0.05? ¿Es la mejor prueba de nivel 0.05? 

c. Si el 60% de todos los fanáticos prefieren las cuerdas de 
tripa, calcule la probabilidad de un error de tipo II utili¬ 
zando la región apropiada de la parte (a). Repita si el 
80% de todos los fanáticos prefieren las cuerdas de tripa. 


8.4 Valores P 311 

d. Si 13 de los 20 jugadores prefieren las cuerdas de tripa, 
¿Deberá ser rechazada H 0 si se utiliza un nivel de signi¬ 
ficación de 0.10? 

43 . Un fabricante de artículos de plomería desarrolló un nuevo ti¬ 
po de llave de agua sin empaques. Sea P = R(una llave selec¬ 
cionada al azar de este tipo desarrollará una fuga dentro de 2 
años en uso normal). El fabricante decidió proseguir con la 
producción a menos que se pueda determinar que p es dema¬ 
siado grande; el valor límite aceptable de p se especifica como 
0.10. El fabricante decide someter a n de estas llaves a una 
prueba acelerada (simulando de manera aproximada dos años 
de uso normal). Con X = el número entre las n llaves que de¬ 
sarrollan fugas antes de que concluya la prueba, la producción 
arrancará a menos que la X observada sea demasiado grande. 
Se decidió que si p = 0.10, la probabilidad de no proseguir de¬ 
berá ser cuando mucho de 0.10, en tanto que si p = 0.30 la pro¬ 
babilidad de proseguir deberá ser cuando mucho de 0.10. ¿Se 
puede utilizar n = 10? ¿n — 20? ¿n = 25? ¿Cuál es la región 
de rechazo apropiada con la n seleccionada y cuáles son las 
probabilidades de error reales cuando se utiliza esta región? 

44 . Científicos piensan que los robots desempeñarán un rol cru¬ 
cial en fábricas en las siguientes décadas. Suponga que en 
un experimento para determinar si el uso de robots para ins¬ 
talar cables de computadora es factible, se utilizó un robot 
para ensamblar 500 cables. Se examinaron los cables y se 
encontraron 15 defectuosos. Si los ensambladores humanos 
tienen una proporción de cables defectuosos de 0.035 
(3.5%), ¿Apoyan estos datos la hipótesis de que la propor¬ 
ción de cables defectuosos es menor con robots que con hu¬ 
manos? Use un nivel de significación de 0.01. 


| 8.4 Valores P 


Una forma de reportar el resultado de un análisis de hipótesis es decir simplemente si la hipóte¬ 
sis nula fue rechazada a nivel de significación específico. Por consiguiente un investigador po¬ 
dría afirmar que si H 0 fue rechazada a nivel de significación de 0.05 o que el uso de una prueba 
de nivel 0.01 dio por resultado no rechazar H 0 . Este tipo de afirmación es un tanto inadecuada 
porque no dice nada sobre si la conclusión es un tanto dudosa o bastante precisa. Una dificultad 
relacionada es que semejante reporte traslada el nivel de significación a otros tomadores de 
decisiones. En muchas situaciones en las que hay que tomar una decisión, los individuos pueden 
tener diferentes puntos de vista en cuanto a las consecuencias de un error de tipo I o de tipo II. 
Cada individuo desearía entonces seleccionar su propio nivel de significación —algunos selec¬ 
cionarían a = 0.05, otros 0.01 y así sucesivamente— y llegar a un conclusión por lo tanto. Es¬ 
to conduciría a que algunos individuos rechacen H 0 en tanto que otros concluirían que los datos 
no muestran una contradicción suficientemente fuerte en contra de H 0 para justificar su rechazo. 

Ejemplo 8.14 Se sabe que el tiempo promedio verdadero para el alivio inicial del dolor de un analgésico 
éxito en ventas es de 10 min. Sea p el tiempo promedio verdadero para el alivio del dolor 
de un analgésico recién desarrollado por una compañía. Esta desea producir y comerciali¬ 
zar este analgésico sólo si proporciona un alivio más rápido que el que más se vende, así 
que desea probar H 0 : p = 10 contra ll á \ p < 10. Sólo si la evidencia experimental condu¬ 
ce al rechazo de H 0 se introducirá el nuevo analgésico. Tras de ponderar la seriedad relati¬ 
va de cada tipo de error, se debe acordar un solo nivel de significación y tomar la decisión 
de —rechazar H 0 e introducir o no el analgésico— a ese nivel. 

Suponga que el nuevo analgésico ha sido introducido. La compañía apoya su afirma¬ 
ción de alivio más rápido declarando que, con base en un análisis de datos experimentales, 
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H 0 : /jl = 10 fue rechazada a favor de //,/ ¡x < 10 utilizando un nivel de significación a = 
0.10. Cualquier individuo que considere cambiar a este nuevo analgésico naturalmente de¬ 
searía sacar sus propias conclusiones en cuanto a la validez de la afirmación. Los individuos 
que están satisfechos con el analgésico que más se vende considerarían un error de tipo I (al 
concluir que el nuevo producto proporciona un alivio más rápido cuando en realidad no 
lo hace) tan serio que desearían utilizar a = 0.05, 0.01, o incluso niveles más pequeños. 
Desafortunadamente, la naturaleza de la afirmación de la compañía evita que un individuo 
llegue a una conclusión a semejante nivel. La compañía ha impuesto su propia selección 
de nivel de significación en otros. El reporte podría haber sido elaborado en una manera que 
permitiera a cada individuo flexibilidad al sacar una conclusión a un nivel a personal¬ 
mente seleccionado. ■ 

Un valor P transmite mucha información sobre la fuerza de la evidencia en contra de 
H 0 y permite que un individuo saque una conclusión a cualquier nivel específico a. Antes 
de dar una definición general, considérese cómo la conclusión en un problema de prueba de 
hipótesis depende del nivel seleccionado a. 

Ejemplo 8.15 El problema de contenido de nicotina discutido en el problema 8.5 implicó probar H 0 : ¡jl = 1.5 
contra H d : ¡x> 1.5. Debido a la desigualdad presente en H d , la región de rechazo es de cola su¬ 
perior, con H 0 rechazada si z s z a . Suponga que z = 2.10. La tabla adjunta muestra la región 
de rechazo con cada uno de cuatro niveles a diferentes junto con la conclusión resultante. 



Nivel de 
significación a 

Región de rechazo 

Conclusión 

0.05 

z> 1.645 

Rechazar H 0 

0.025 

z> 1.96 

Rechazar H 0 

0.01 

z > 2.33 

No rechazar H 0 

0.005 

z £ 2.58 

No rechazar H 0 



Curva normal estándar (z) 



Curva z 


Curva z 




Figura 8.5 Relación entre a y área de cola capturada z: a) área de cola capturada por z calculada; 
b) cuando a > 0.0179, z a < 2.10 y H 0 es rechazada; c) cuando a < 0.0179, z a > 2.10 y H 0 no es 
rechazada. 
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Con un nivel a relativamente grande, el valor crítico z a no está muy alejado en la cola su¬ 
perior; 2.10 excede el valor crítico y por lo tanto H 0 es rechazada. Sin embargo, a medida 
que a disminuye, el valor crítico se incrementa. Con a pequeño, el valor critico z es gran¬ 
de, 2.10 es menor que z a y H 0 no es rechazada. 

Recuérdese que con una prueba z de cola superior, a es exactamente el área debajo de 
la curva z a la derecha del valor crítico z a - Es decir, una vez que se especifica a, se selec¬ 
ciona el valor crítico para capturar área de cola superior a. La tabla A.3 muestra que el área 
a la derecha de 2.10 es 0.0179. Con un nivel a más grande que 0.0179 corresponde a z a < 
2.10. Una a menor que 0.0179 requiere del uso de un valor crítico de z que exceda 2.10. La 
decisión sobre un nivel particular de a depende de cómo el nivel a seleccionado se compa¬ 
ra con el área de cola capturada por el valor z calculado. Esto se ilustra en la figura 8.5. Ob¬ 
sérvese en particular que 0.0179, el área de cola capturada, es el nivel más pequeño a al cual 
H 0 sería rechazada, porque con cualquier nivel a más pequeño se obtiene un valor crítico z 
que excede de 2.10, de modo que 2.10 no se encuentra en la región de rechazo. ■ 

En general, supóngase que se ha determinado la distribución de probabilidad de un es¬ 
tadístico de prueba cuando H 0 es verdadera. Entonces, con un nivel a especificado, la región 
de rechazo se determina encontrando un valor o valores críticos que capturen área de cola 
a (de cola superior, inferior o de dos colas, cualquiera que sea apropiada) bajo la curva de 
distribución de probabilidad. El valor a más pequeño con el cual H 0 sería rechazada es el 
área de cola capturada por el valor calculado del estadístico de prueba. Este valor a más pe¬ 
queño es el valor P. 



DEFINICIÓN 


El valor P (o nivel de significación observado ) es el nivel de significación más pe¬ 
queño al cual H 0 sería rechazada cuando se utiliza un procedimiento de prueba espe¬ 
cificado con un conjunto de datos dado. Una vez que se ha determinado el valor P, la 
conclusión a un nivel particular a resulta de comparar el valor P con a: 

1. Valor P < a => rechazar H 0 al nivel a. 

2. Valor P > a => no rechazar H 0 al nivel a. 



Se acostumbra llamar significativos a los datos cuando H 0 es rechazada y no signifi¬ 
cativos de lo contrario. El valor P es entonces el nivel más pequeño al cual los datos son sig¬ 
nificativos. Una manera fácil de visualizar la comparación del valor P con el nivel a 
seleccionado es trazar una imagen como la de la figura 8.6. El cálculo del valor P depende 
de si la prueba es de cola superior, inferior o de dos colas. No obstante, una vez calculada, 
la comparación con a no depende de qué tipo de prueba se utilizó. 


Valor P = nivel más pequeño al cual 
Hq puede ser rechazada 


0 b) a) 1 

Figura 8.6 Comparación de a y el valor P: a) rechazar H 0 cuando a queda aquí; b) no rechazar H 0 
cuando a queda aquí. 


Ejemplo 8.16 Supóngase que cuando se analizaron los datos de un experimento que implican el nuevo 
(continuación analgésico, el valor P para probar H 0 : /jl = 10 contra H¿. /jl < 10 se calculó como 0.0384. 

del ejemplo Como a = 0.05 es más grande que el valor P (0.05 queda en el intervalo (a) de la figura 8.6) 

8.14) 
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H 0 sería rechazada por cualquiera que realice la prueba al nivel 0.05. Sin embargo, al nivel 
0.01, H 0 no sería rechazada porque 0.01 es más pequeño que el nivel más pequeño (0.0384) 
al cual H 0 puede ser rechazada. ■ 

Los programas de computadora más utilizados incluyen automáticamente un valor P 
cuando se analiza una hipótesis. Se puede sacar una conclusión directamente de los datos de 
salida, sin referencia a una tabla de valores críticos. 

Una definición alternativa útil equivalente a la que se acaba de dar es como sigue: 


DEFINICIÓN 


El valor P es la probabilidad calculada suponiendo que H 0 es verdadera, de obtener 
un valor estadístico de prueba por lo menos tan contradictorio a H 0 como el valor que 
en realidad se obtuvo. Mientras más pequeño es el valor de P, más contradictorios son 
los datos a H 0 . 


Por consiguiente si z = 2.10 para una prueba z de cola superior, el valor P = P(Z > 2.10 
cuando H 0 es verdadera) = 1 — <1>(2.10) = 0.0179 como antes. Mucho ojo: ¡el valor de P 
no es la probabilidad de que H 0 sea verdadera, ni es una probabilidad de error! 

Valores P para pruebas z 

El valor P para una prueba z (una basada en un estadístico de prueba cuya distribución, 
cuando H 0 es verdadera, es por lo menos aproximadamente estándar normal) es fácil de 
determinar a partir de la información de la tabla A. 3. Considérese una prueba de cola su¬ 
perior y sea z el valor calculado del estadístico de prueba Z. La hipótesis nula es rechaza¬ 
da si z — Z a y el valor P es el a más pequeño para el cual este es el caso. Como z a 
se incrementa a medida que a disminuye, el valor P es el valor de a con el cual z = z a . Es 
decir, el valor P es exactamente el área capturada por el valor calculado z en la cola supe¬ 
rior de la curva normal estándar. El área acumulativa correspondiente es ( b(z), así que en 
este caso valor P = 1 — í>(z). 

Un argumento análogo para una prueba de cola inferior demuestra que el valor P es el 
área capturada por el valor calculado z en la cola inferior de la curva normal estándar. Se debe 
tener más cuidado en el caso de una prueba de dos colas. Supóngase primero que z es 
positivo. Entonces el valor P es el valor de a que satisface z = z :t/2 (es decir, z calculado = 
valor crítico de cola superior). Esto dice que el área capturada en la cola superior es la mi¬ 
tad del valor P, de modo que valor P = 2[1 — <b(z)]. Si z es negativo, el valor P es el a con 
el cual z = ~Z aP , o, de forma equivalente, — z = z„ /2 , así que valor P = 2[1 — <t>(— z)]. Co¬ 
mo —z = I z I cuando z es negativo, valor P = 2[1 — <t>( I z |)] con z positivo o negativo. 


í 1 - <L(z) 

para una prueba de cola superior 

Valor P: I’ = j <L(z) 

para una prueba de cola inferior 

[ 2[1 -®(|z|)] 

para una prueba de dos colas 


Cada una de éstas es la probabilidad de obtener un valor por lo menos tan extremo como el 
que se obtuvo (suponiendo que H 0 es verdadera). Los tres casos se ilustran en la figura 8.7. 

El siguiente ejemplo ilustra el uso de la aproximación del valor P a la prueba de hi¬ 
pótesis por medio de una secuencia de pasos modificados con respecto a la secuencia pre¬ 
viamente recomendada. 
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3. Prueba de dos colas 

H a contiene la desigualdad =£ 


Valor P = suma del área en dos colas = 2[1 - 0(|z|)] 



Z, —z calculada 


Figura 8.7 Determinación del valor Ppara una prueba z. 


Ejemplo 8.17 


1. Parámetro de interés: ¡jl = espesor de oblea promedio verdadero 

2. Hipótesis nula: H 0 : ¡jl = 245 

3. Hipótesis alternativa: H d : /i A 245 

_ i - 245 

s/\ r ñ 

246.18 - 245 

-7=^ = 2.32 

3.60/V5Ó 

6. Determinación del valor P: Como la prueba es de dos colas, 

Valor P = 2(1 - $(2.32)) = 0.0204 

7. Conclusión: Con un nivel significativo de 0.01, H 0 no sería rechazada puesto que 0.0204 

> 0.01. A este nivel de significación, existe suficiente evidencia para concluir que el es¬ 
pesor promedio verdadero difiere del valor objetivo. ■ 


4. Fórmula para el valor del estadístico de prueba: 

5. Cálculo del valor del estadístico de prueba: z = 


El espesor objetivo de obleas de silicio utilizadas en cierto tipo de circuito integrado es de 
245 ¡Jim. De una muestra de 50 obleas, cada una con un espesor determinado, se obtiene una 
media de espesor de 246.18 /im y una desviación estándar de 3.60 pin. ¿Sugieren estos da¬ 
tos que el espesor de oblea promedio verdadero es algún otro diferente del valor objetivo? 


Valores P para pruebas t 

Así como el valor P para una prueba z es un área de curva z, el valor P para una prueba t se¬ 
rá un área de curva t. La figura 8.8 en la siguiente página ilustra los tres casos diferentes. El 
número de grados de libertad para la prueba t con una muestra es n - 1. 
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Curva t para grados de libertad pertinentes 



Curva t para grados de libertad pertinentes 



3. Prueba de dos colas 

H a contiene la desigualdad =£ 


Valor P = suma del área en dos colas 



t, —t calculada 




Figura 8.8 Valores Ppara pruebas t. 




La tabla de valores críticos t previamente utilizada para intervalos de confianza y 
predicción no contienen suficiente información sobre cualquier distribución t particular 
que permita la determinación precisa de áreas deseadas. Así que se ha incluido otra tabla 
t en la tabla A.8, una que contiene una tabulación de áreas de cola superior de curva t. Ca¬ 
da columna de la tabla es para un número diferente de grados de libertad y las filas son 
para valores calculados del estadístico de prueba t que van desde 0.0 hasta 4.0 en incre¬ 
mentos de 0.1. Por ejemplo, el número 0.074 aparece en la intersección de la fila 1.6 y la 
columna de 8 grados de libertad, por lo que el área bajo la curva de 8 grados de libertad 
a la derecha de 1.6 (un área de cola superior) es 0.074. Como las curvas t son simétricas, 
0.074 también es el área bajo la curva de 8 grados de libertad a la izquierda de —1.6 (un 
área de cola inferior). 

Supóngase, por ejemplo, que una prueba de H 0 : ¡jl = 100 contra H, '. ¡jl > 100 está ba¬ 
sada en la distribución t de 8 grados de libertad. Si el valor calculado del estadístico de prue¬ 
ba es t = 1.6, entonces el valor P para esta prueba de cola superior es 0.074. Como 0.074 
excede de 0.05, H 0 no podría ser rechazada a un nivel de significación de 0.05. Si la hipó¬ 
tesis alternativa es H a : ¡l < 100 y una prueba basada en 20 grados de libertad da t = —3.2, 
entonces la tabla A.8 muestra que el valor P es el área de cola inferior capturada 0.002. La 
hipótesis nula puede ser rechazada al nivel 0.05 o 0.01. Considérese probar H 0 : /x, — /x 2 = 0 
contra H, '. /i t — /jl 1 P 0, la hipótesis nula afirma que las medias de las dos poblaciones son 
idénticas, en tanto que la hipótesis alternativa afirma que son diferentes sin especificar una 
dirección de alejamiento de H 0 . Si una prueba t está basada en 20 grados de libertad y t = 
3.2, entonces el valor P para esta prueba de dos colas es 2(0.002) = 0.004. Este también se¬ 
ría el valor P para t = —3.2. El área de cola se duplica porque los valores tanto más gran¬ 
des que 3.2 como más pequeños que —3.2 contradicen más a H 0 que lo que se calculó 
(valores alejados en una u otra cola de la curva t). 
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Ejemplo 8.18 En el ejemplo 8.9, se realizó una prueba de /V 0 : ¡jl = 25 contra H a : ¡jl > 25 basada en 4 grados 
de libertad. El valor calculado de t fue 1.04. Si se examina la columna de 4 grados de libertad de 
la tabla A.8 hacia abajo hasta la fila 1.0, se ve que el ingreso es 0.187, así que el valor P ~ 
0.187. Este valor P es claramente más grande que cualquier nivel de significación a (0.01, 
0.05 e incluso 0.10), por lo que no hay razón para rechazar la hipótesis nula. Los datos de sa¬ 
lida obtenidos con MINITAB del ejemplo 8.9 incluyen un valor P = 0.18. Los valores P obte¬ 
nidos con programas de computadora serán más precisos que los obtenidos de la tabla A.8 
puesto que los valores de t que aparecen en la tabla son precisos sólo a décimos de dígito. ■ 


EJERCICIOS Sección 8.4 (45-60) 


45 . ¿Con cuál de los valores P dados sería rechazada la hipóte¬ 
sis nula cuando se realiza una prueba de nivel 0.05? 

a. 0.001 b. 0.021 c. 0.078 

d. 0.047 e. 0.148 

46 . Se dan pares de valores P y niveles de significación, a. Pa¬ 
ra cada par, diga si el valor P observado conduciría al recha¬ 
zo de H 0 en el nivel de significación dado. 

a. Valor P = 0.084, a = 0.05 

b. Valor P = 0.003, a = 0.001 

c. Valor P = 0.498, a = 0.05 

d. Valor P = 0.084, a = 0.10 

e. Valor P = 0.039, a = 0.01 

f. Valor P = 0.218, a = 0.10 

47 . Sea /x el tiempo medio de reacción a un cierto estímulo. Pa¬ 
ra una prueba z con muestra grande de H 0 : /x = 5 contra 7í a : 
/x > 5, halle el valor P asociado con cada uno de los valo¬ 
res dados del estadístico de prueba z 

a. 1.42 b. 0.90 c. 1.96 d. 2.48 e. -0.11 

48 . Se supone que llantas de un cierto tipo recién compradas es¬ 

tán infladas a una presión de 30 lb/pulg 2 . Sea /x la presión pro¬ 
medio verdadera. Halle el valor P asociado con cada valor 
estadístico z dado para probar H 0 : /x = 30 contra H a : /x + 30. 
a. 2.10 b. -1.75 c. -0.55 d. 1.41 e. -5.3 

49 . Dé tanta información como pueda sobre el valor P de una 
prueba t en cada una de las siguientes situaciones: 

a. Prueba de cola superior, gl = 8, t — 2.0 

b. Prueba de cola inferior, gl = 11, t = —2.4 

c. Prueba de dos colas, gl = 15, t = —1.6 

d. Prueba de cola superior, gl = 19, t = —0.4 

e. Prueba de cola superior, gl = 5, t = 5.0 

f. Prueba de dos colas, gl = 40, t = —4.8 

50 . La pintura utilizada para trazar rayas en carreteras debe re¬ 
flejar suficiente luz para que sea claramente visible de no¬ 
che. Sea /x la lectura de reflectómetro promedio verdadera 
de un tipo de pintura considerada. Una prueba de H 0 : /jl = 
20 contra H a : /x > 20 se basará en una muestra aleatoria de 
tamaño n de una distribución de población normal. ¿Qué 
conclusión es apropiada en cada una de las siguientes si¬ 
tuaciones? 

a. n = 15, t = 3.2, a — 0.05 

b. n = 9, t = 1.8, a = 0.01 

c. n = 24, t = —0.2 


51. Sea /x la concentración de receptor de suero en todas las 
mujeres embarazadas. Se sabe que el promedio de todas 
las mujeres es de 5.63. El artículo “Serum Transferrin Re¬ 
ceptor for the Detection of Iron Deficiency in Pregnancy” 
(Amer. J. Clinical Nutr., 1991: 1077-1081) reporta que el 
valor P > 0.10 para una prueba de H 0 : /x = 5.63 contra /7 a : 
/x 5.63 basada en n = 176 mujeres embarazadas. Con un 
nivel de significación de 0.01, ¿qué concluiría? 

52 . El artículo “Analysis of Reserve and Regular Bottlings: Why 
Pay for a Difference Only the Critics Claim to Notice?” 
{Chance, verano de 2005, págs. 9-15) reportó sobre un expe¬ 
rimento para investigar si los catadores de vino podían distin¬ 
guir entre vinos de reserva más caros y sus contrapartes 
regulares. El vino fue presentado a los catadores en cuatro re¬ 
cipientes marcados A. B, C y D con dos de ellos conteniendo 
el vino de reserva y los otros dos el vino regular. Cada catador 
seleccionó al azar tres de los recipientes, degustó los vinos se¬ 
leccionados e indicó cual de los tres creía era diferente de los 
otros dos. De los n = 855 ensayos de degustación, 346 dieron 
por resultado la distinción correcta (o el de reserva que difería 
de los dos vinos regulares o el vino regular que difería de dos 
reservas). ¿Proporciona esto evidencia contundente para con¬ 
cluir que los catadores de este tipo tienen una cierta capacidad 
para distinguir entre vinos de reserva y regulares? Formule y 
pmebe las hipótesis pertinentes con el método del valor P. ¿Se 
siente particularmente impresionado con la capacidad de los 
catadores de distinguir entre los dos tipos de vino? 

53 . Un fabricante de aspirina llena los frascos por peso en lugar 
de por conteo. Como cada frasco debe contener 100 table¬ 
tas, el peso promedio por tableta deberá ser de 5 granos. Ca¬ 
da una de las 100 tabletas tomada de un lote muy grande es 
pesada, y el resultado es un peso promedio muestral por ta¬ 
bleta de 4.87 granos y una desviación estándar muestral de 
0.35 granos. ¿Proporciona esta información una fuerte evi¬ 
dencia para concluir que la compañía no está llenando sus 
frascos como lo anuncia? Pruebe las hipótesis con a = 0.01 
calculando primero el valor P y luego comparándolo con el 
nivel de significación especificado. 

54 . Debido a la variabilidad en el proceso de fabricación, el 
punto de cadencia de una muestra de acero suave sometida 
a un esfuerzo creciente normalmente diferirá del punto de 
cadencia teórico. Sea p la proporción de muestras que ce¬ 
den antes de su punto de cadencia teórico. Si basándose en 
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una muestra se concluye que más del 20% de todos los es¬ 
pecímenes ceden antes del punto teórico, el proceso de pro¬ 
ducción tendrá que ser modificado. 

a. Si 15 de 60 especímenes ceden antes del punto teórico, 
¿cuál es el valor P cuando se utiliza la prueba apropiada 
y qué le aconsejaría hacer a la compañía? 

b. Si el porcentaje verdadero de “cadencias tempranas” es en 
realidad de 50% (de modo que el punto teórico sea la me¬ 
diana de la distribución de cadencia) y se utiliza una 
prueba de nivel 0.01, ¿cuál es la probabilidad de que la 
compañía concluya que es necesario modificar el proceso? 

55 . Muchos consumidores están recurriendo a los productos ge¬ 
néricos como una forma de reducir el costo de los medica¬ 
mentos recetados. El artículo “Commercial Information on 
Drugs: Confusing to the Physician?” (J. of Drug Issues, 
1988: 245-257) da los resultados de una encuesta de 102 
doctores. Sólo 47 de los encuestados conocían el nombre 
genérico de la metadona. ¿Proporciona esto una fuerte evi¬ 
dencia para concluir que menos de la mitad de todos los 
médicos conocen el nombre genérico de la metadona? Rea¬ 
lice una prueba de hipótesis utilizando un nivel de signifi¬ 
cación de 0.01 y el método del valor P. 

56 . Se obtuvo una muestra aleatoria de especímenes de suelo y 
se determinó la cantidad (%) de materia orgánica presente 
en él por cada espécimen y se obtuvieron los datos adjuntos 
(tomados de “Engineering Properties of Soil”, Soil Science , 
1998: 93-102). 


1.10 

5.09 

0.97 

1.59 

4.60 

0.32 

0.55 

1.45 

0.14 

4.47 

1.20 

3.50 

5.02 

4.67 

5.22 

2.69 

3.98 

3.17 

3.03 

2.21 

0.69 

4.47 

3.31 

1.17 

0.76 

1.17 

1.57 

2.62 

1.66 

2.05 




Los valores de la media muestral, desviación estándar 
muestral y error estándar (estimado) de la media son 2.481, 
1.616 y 0.295, respectivamente. ¿Sugieren estos datos que 
el porcentaje promedio verdadero de materia orgánica pre¬ 
sente en el suelo es algún otro diferente de 3%. Realice una 
prueba de la hipótesis apropiada a un nivel de significación 
de 0.10 determinando primero el valor P. ¿Sería diferente 
su conclusión si se hubiera usado a — 0.05? [Nota: Una 
curva de probabilidad normal de los datos muestra un pa¬ 
trón aceptable a la luz del tamaño de muestra razonable¬ 
mente grande.] 

57. Los tiempos de la primera activación de los aspersores con 
una serie de pruebas con sistemas aspersores de prevención 
utilizando una espuma que forma una película acuosa fue¬ 
ron (en seg) 

27 41 22 27 23 35 30 33 24 27 28 22 24 


(véase “Use of AFFF in Sprinkler Systems”, Fire Technology, 
1976: 5. El sistema se diseñó de modo que el tiempo de acti¬ 
vación promedio verdadero sea cuando mucho de 25 seg en ta¬ 
les condiciones. ¿Contradicen los datos fuertemente la validez 
de esta especificación de diseño? Prueba las hipótesis pertinen¬ 
tes a nivel de significación de 0.05 con el método del valor P. 

58 . Se diseñó una pluma de modo que el promedio verdadero 
de duración en condiciones controladas (implicando el uso de 
una máquina de escribir) sea por lo menos de 10 horas. Se 
seleccionó una muestra aleatoria de 18 plumas, se determinó 
la duración de cada una y una curva de probabilidad normal 
de los datos resultantes apoya el uso de una prueba t con 
una muestra. 

a. ¿Qué hipótesis deberá ser probada si los investigadores 
creen a priori que la especificación de diseño ha sido sa¬ 
tisfecha? 

b. ¿Qué conclusión es apropiada si se prueban las hipóte¬ 
sis de la parte (a), t = —2.3 y a — 0.05? 

c. ¿Qué conclusión es apropiada si se prueban las hipóte¬ 
sis de la parte (a), t= —1.8 y a = 0.01? 

d. ¿Qué se deberá concluir si se prueban las hipótesis de la 
parte (a) y t = —3.6? 

59 . Un espectrofotómetro utilizado para concentración de CO 
[ppm (partes por millón) por volumen] se somete a prueba en 
cuanto a precisión tomando lecturas de un fabricado (llamado 
gas span) en el cual la concentración de CO se controla con 
precisión a 70 ppm. Si las lecturas sugieren que el espectrofo¬ 
tómetro no está funcionando apropiadamente, la concentración 
medida en muestras de gas span está normalmente distribuida. 
Con base en las seis lecturas —85, 77, 82, 68, 72 y 69— ¿es 
necesaria una recalibración? Realice una pmeba de las hipóte¬ 
sis pertinentes utihzando el método del valor P con a = 0.05. 

60. La conductividad relativa de un semiconductor está deter¬ 
minada por la cantidad de impurezas “adicionadas” al dis¬ 
positivo durante su fabricación. Se tiene que utilizar un 
diodo de silicio para propósitos específicos requiere un vol¬ 
taje de corte promedio de 0.60 V y si éste no se alcanza, la 
cantidad de impurezas debe ser ajustada. Se seleccionó una 
muestra de diodos y se determinó el voltaje de corte. Los 
datos de salida adjuntos obtenidos con SAS son el resulta¬ 
do de una solicitud de probar las hipótesis apropiadas. 

N Mean Std Dev T Prob>|T| 

15 0.0453333 0.0899100 1.9527887 0.0711 

[Nota: SAS prueba explícitamente H 0 : pt = 0, así que para 
probar H 0 : pt = 0.60, el valor nulo 0.60 debe ser restado de 
cada x¡; la media reportada es entonces el promedio de los 
valores (x¡ — 0.60). También, el valor P de SAS siempre es 
para una prueba de dos colas.] ¿Qué se concluiría con un ni¬ 
vel de significación de 0.01? ¿de 0.05? ¿de 0.10? 


8.5 Algunos comentarios sobre la selección de una prueba 



Una vez que el experimentador ha decidido sobre la cuestión de interés y el método de ob¬ 
tención de datos (el diseño del experimento), la construcción de una prueba apropiada se 
compone de tres pasos distintos: 
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8.5 Algunos comentarlos sobre la selección de una prueba 

1. Especificar un estadístico de prueba (la función de los valores observados que servirá 
para tomar una decisión). 

2. Decidir sobre la forma general de la región de rechazo (típicamente rechazar H 0 con va¬ 
lores apropiadamente grandes del estadístico de prueba, rechazar con valores apropiada¬ 
mente pequeños o rechazar con valores pequeños o grandes). 

3. Seleccionar el valor o valores críticos numéricos específicos que separarán la región de 
rechazo de la región de aceptación (obteniendo la distribución del estadístico de prueba 
cuando H 0 es verdadera y luego seleccionar un nivel de significación). 

En los ejemplos presentados hasta ahora, se realizaron los pasos 1 y 2 en una manera ad hoc 
mediante intuición. Por ejemplo, cuando la población subyacente se supuso normal con me¬ 
dia ¡i y cr conocida, se procedió desde X hasta el estadístico de prueba estandarizada 

X- /i. 0 

cr/Vn 

Para probar H 0 : ¡i = ¡jl 0 contra // a : /a > /i 0 , la intuición sugirió entonces rechazar H 0 cuan¬ 
do z era grande. Por último, se determinó el valor crítico especificando el nivel de signifi¬ 
cación a y utilizando el hecho de que Z tiene una distribución normal estándar cuando H 0 
es verdadera. La confiabilidad de la prueba para tomar la decisión correcta puede ser eva¬ 
luada estudiando probabilidades de error de tipo II. 

Los temas que tienen que ser considerados al realizar los pasos 1-3 comprenden las 
preguntas: 

1. ¿Cuáles son las implicaciones y consecuencias prácticas de seleccionar un nivel de 
significación particular una vez que se han determinado los demás aspectos de una 
prueba? 

2. ¿Existe un principio general, que no dependa de la intuición, que pueda ser utilizado pa¬ 
ra obtener buenos o mejores procedimientos de prueba? 

3. Cuando dos o más pruebas son apropiadas en una situación dada, ¿cómo se comparan 
las pruebas para decidir cuál deberá ser utilizada? 

4. Si una prueba se deriva con arreglo a suposiciones específicas sobre la distribución o po¬ 
blación muestreada, ¿cómo funcionará la prueba cuando se violan las suposiciones? 

Significación estadística contra práctica 

Aunque el proceso de llegar a una decisión utilizando la metodología de probar hipóte¬ 
sis clásicas implica seleccionar un nivel de significación y luego rechazar o no rechazar 
H 0 , a ese nivel a, reportando simplemente el nivel a utilizado y la decisión alcanzada da 
un poco de la información contenida en los datos muéstrales. En especial, cuando los re¬ 
sultados de un experimento han de ser comunicados a una gran audiencia, el rechazo de H 0 
a nivel de 0.05 será mucho más convincente si el valor observado del estadístico de prue¬ 
ba excede en gran medida el valor crítico de 5% que si apenas excede ese valor. Esto 
es precisamente lo que condujo a la noción de valor P como una forma de reportar sig¬ 
nificación sin imponer una a particular a otros que pudieran desear sacar sus propias 
conclusiones. 

Incluso si se incluye un valor P en un resumen de resultados, sin embargo, puede 
haber dificultad al interpretar este valor y al tomar una decisión. Esto es porque un valor 
P pequeño, el que ordinariamente indicaría significación estadística es que sugeriría 
fuertemente el rechazo de H 0 a favor de H á , puede ser el resultado de un tamaño de muestra 
grande en combinación con un alejamiento de H 0 que tiene poca significación práctica. 
En muchas situaciones experimentales, sólo valdría la pena detectar los alejamientos de 
H 0 de gran magnitud, en tanto que un alejamiento pequeño de H 0 tendría poca significa¬ 
ción práctica. 
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320 CAPÍTULO 8 Pruebas de hipótesis basadas en una sola muestra 

Considérese como ejemplo probar H 0 : fi = 100 contra H d : p. > 100 donde p es la me¬ 
dia de una población normal con a = 10. Supóngase que un valor verdadero de p = 101 no 
representaría un alejamiento serio de H 0 en el sentido de no rechazar H 0 cuando p = 101 
sería un error relativamente costoso. Con tamaño de muestra razonablemente grande n, es¬ 
ta p conduciría a un valor x próximo a 101, así que no se desearía esta evidencia muestral 
para argumentar fuertemente a favor del rechazo de H 0 cuando x = 101 es observado. Para 
varios tamaños muéstrales, la tabla 8.1 registra tanto el valor P cuando x = 101 y también 
la probabilidad de no rechazar H 0 al nivel 0.01 cuando p = 101. 

La segunda columna en la tabla 8.1 muestra que incluso con tamaños de muestra mo¬ 
deradamente grandes, el valor P de x = 101 argumenta fuertemente a favor del rechazo de 
H 0 , en tanto que el valor x observado sugiere que en términos prácticos el valor verdadero 
de ¡x difiere poco del valor nulo fi 0 = 100. La tercera columna señala que incluso cuando 
existe poca diferencia práctica entre la ¡jl verdadera y el valor nulo, con un nivel de signifi¬ 
cación fijo un tamaño de muestra grande casi siempre conduce al rechazo de la hipótesis nu¬ 
la a ese nivel. Resumiendo, se debe tener un especial cuidado al interpretar evidencia 
cuando el tamaño de muestra es grande, puesto que cualquier alejamiento pequeño de H 0 
con toda seguridad será detectado por una prueba, aunque semejante alejamiento puede te¬ 
ner poca significación práctica. 


Tabla 8.1 Una ilustración del efecto del tamaño de muestra en los valores Py j3 


n 

Valor P cuando x = 101 

/S(101) prueba de 
nivel 0.01 

25 

0.3085 

0.9664 

100 

0.1587 

0.9082 

400 

0.0228 

0.6293 

900 

0.0013 

0.2514 

1600 

0.0000335 

0.0475 

2500 

0.000000297 

0.0038 

10000 

7.69 X 10- 24 

0.0000 


El principio de razón de verosimilitudes 

Sean x¡, x 2 ,..., x n las observaciones en una muestra aleatoria de tamaño n de una distribu¬ 
ción de probabilidad f(x; 9). La distribución conjunta evaluada con estos valores muéstrales 
es el producto/(.íp 9) ■ f(x 2 ', 9) ./(x n ; 9). Como en la discusión de estimación de má¬ 

xima verosimilitud, la función de verosimilitud es esta distribución conjunta considerada 
como una función de 9. Considérese probar H 0 : 9 está en íi () contra H d : 9 está en íl a , donde 
fi 0 y íl a están desarticuladas (por ejemplo, H 0 : 9 < 100 contra H d . 9 > 100. El principio 
de razón de verosimilitudes para la construcción de una prueba prosigue como sigue: 

1. Determinar el valor más grande de verosimilitud para cualquier 9 en íí 0 (determinando 
la estimación de máxima verosimilitud dentro de ft 0 y sustituyendo de vuelta en la fun¬ 
ción de verosimilitud). 

2. Determinar el valor más grande de la probabilidad de que cualquier 9 en íl a . 

3. Formar la razón 

,, verosimilitud máxima para 9 en ÍL, 

A(Xj, . . . ,x n ) = - 

verosimilitud máxima para 9 en Í2 a 

La razón A(x, . .., x n ) se llama valor estadístico de razón de verosimilitud. El procedimien¬ 
to de prueba consiste en rechazar H 0 cuando esta razón es pequeña. Es decir, se elige una 
constante k y H 0 es rechazada si A(x,, . . . , x n ) < k. Así pues H 0 es rechazada cuando el 
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denominador de A excede en gran medida al numerador, lo que indica que los datos son mu¬ 
cho más compatibles con H ñ que con H 0 . 

La constante k se selecciona para que dé el tipo de probabilidad de error de tipo I de¬ 
seado. Con frecuencia la desigualdad A < k puede ser manipulada para que produzca una 
condición equivalente más simple. Por ejemplo, para probar H 0 : ¡i < /i 0 contra ¡x> ¡jl 0 
en el caso de normalidad, A < k equivale aí> c. Por consiguiente, con c = t an _¡, la prue¬ 
ba de razón de verosimilitud es la prueba t con una muestra. 

El principio de razón de verosimilitud también se aplica cuando las X¡ tienen diferen¬ 
tes distribuciones e incluso cuando son dependientes, aunque la función de verosimilitud 
puede ser complicada en tales casos. Muchos de los procedimientos de prueba que se presen¬ 
tarán en capítulos subsiguientes se obtienen a partir del principio de razón de verosimilitud. 
Estas pruebas a menudo reducen al mínimo [3 entre todas las pruebas que tienen el nivel a 
deseado, así que verdaderamente son pruebas mejores. Para más detalles y algunos ejemplos 
resueltos, remítase a una de las referencias que aparecen en la bibliografía del capítulo 6. 

Una limitación práctica para el uso del principio de razón de verosimilitud es que, pa¬ 
ra construir el estadístico de prueba de razón de verosimilitud, la forma de la distribución de 
probabilidad de donde proviene la muestra debe ser especificada. Para derivar la prueba t a 
partir del principio de razón de verosimilitud, el investigador debe asumir una función de dis¬ 
tribución de probabilidad normal. Si un investigador desea asumir que la distribución es si¬ 
métrica pero no desea que sea específica con respecto a su forma exacta (tal como normal, 
uniforme o Cauchy), en ese caso el principio falla porque no existe una forma de escribir una 
función de distribución de probabilidad conjunta válida al mismo tiempo para todas las dis¬ 
tribuciones simétricas. En el capítulo 15, se presentarán varios procedimientos de prueba li¬ 
bres de distribución, llamados así porque la probabilidad de un error de tipo I es controlado 
simultáneamente para muchas distribuciones subyacentes diferentes. Estos procedimientos 
son útiles cuando el investigador tiene un conocimiento limitado de la distribución subyacen¬ 
te. Se dirá más sobre las cuestiones 3 y 4 listadas al principio de esta sección. 


EJERCICIOS Sección 8.5 (61-62) 


61. Reconsidere el problema de secado de pintura discutido en 
el ejemplo 8.2. Las hipótesis fueron H 0 : p = 75 contra // a : 
p < 75, suponiendo que el valor de eres 9.0. Considere el 
valor alternativo p = 74, el que en el contexto del proble¬ 
ma presumiblemente no sería un alejamiento prácticamente 
significativo de H 0 . 

a. Con una prueba de nivel 0.01, calcule ¡3 para esta alter¬ 
nativa con tamaños de muestra n = 100, 900 y 2500. 

b. Si el valor observado de X es x = 74, ¿qué puede decir 
sobre el valor P resultante cuando n = 2500? ¿Son los 
datos estadísticamente significativos con cualquiera de 
los valores estándar de tr? 


c. ¿Realmente preferiría utilizar un tamaño de muestra de 
2500 junto con una prueba de nivel 0.01 (haciendo caso 
omiso del costo de semejante experimento)? Explique. 

62. Considere la prueba de nivel 0.01 con muestra grande en la 
sección 8.3 para probar H 0 : p = 0.2 contra /7 a : p > 0.2. 

a. Para el valor alternativo p = 0.21, calcule ¡3( 0.21) con ta¬ 
maños de muestra n = 100, 2500,10 000,40 000 y 90 000. 

b. Para p = x/n = 0.21, calcule el valor P cuando n = 100, 
2500, 10000 y 40000. 

c. En la mayoría de las situaciones, sería razonable utilizar 
una prueba de nivel 0.01 junto con un tamaño de mues¬ 
tra de 40 000 ¿Por qué sí o por qué no? 


EJERCICIOS SUPLEMENTARIOS (63-85) 


63. Una muestra de 50 lentes utilizados en anteojos da un espesor 
medio muestral de 3.05 mm y una desviación estándar mues- 
tral de 0.34 mm. El espesor promedio verdadero deseado de 
los lentes es de 3.20 mm. ¿Sugieren los datos fuertemente que 
el espesor promedio verdadero de los lentes es algún otro di¬ 
ferente del deseado? Haga la prueba con a = 0.05. 


64. En el ejercicio 63, suponga que el experimentador creía 
antes de recopilar los datos que el valor de a era aproxi¬ 
madamente de 0.30. Si el experimentador deseaba que la 
probabilidad de un error de tipo II fuera 0.05 cuando p = 
3.00, ¿Era innecesariamente grande un tamaño de muestra 
50? 
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65 . Se especificó que un cierto tipo de hierro debía contener 0.85 g 
de silicio por cada 100 g de hierro (0.85%). Se determinó el 
contenido de silicio de cada uno de los 25 especímenes selec¬ 
cionados al azar y se obtuvieron los siguientes resultados con 
MINITAB con una prueba de las hipótesis apropiadas. 

Variable N Mean StDev SE Mean T P 

sil cont 25 0.8880 0.1807 0.0361 1.05 0.30 

a. ¿Qué hipótesis se probaron? 

b. ¿A qué conclusión llegaría con un nivel de significación 
de 0.05 y por qué? Responda la misma pregunta para un 
nivel de significación de 0.10. 

66. Un método de enderezar alambre antes de enrollarlo para fa¬ 
bricar resortes se llama “enderezado con rodillos”. El artículo 
“The Effect of Roller and Spinner Wire Straightening on Coi- 
ling Performance and Wire Properties” ( Springs 1987: 27-28) 
reporta sobre las propiedades de la tensión de alambre. Su¬ 
ponga que se selecciona una muestra de 16 alambres y 
cada uno se somete a prueba para determinar su resistencia a 
la tensión (N/mm 2 ). La media y desviación estándar muéstra¬ 
les resultantes son 2160 y 30, respectivamente. 

a. La resistencia media a la tensión de resortes hechos me¬ 
diante una máquina enderezadora rotatoria es de 2150 
N/mm 2 . ¿Qué hipótesis deberán ser probadas para deter¬ 
minar si la resistencia media a la tensión del método de 
rodillos excede de 2150? 

b. Suponiendo que la distribución de la resistencia a la ten¬ 
sión es aproximadamente normal, ¿qué estadístico de 
prueba utilizaría para probar la hipótesis de la parte (a)? 

c. ¿Cuál es el valor del estadístico de prueba con estos datos? 

d. ¿Cúal es el valor P con el valor del estadístico de prue¬ 
ba calculado en la parte (c)? 

e. Con una prueba de nivel 0.05, ¿a qué conclusión llegaría? 

67 . En el artículo “A Rapid Method to Determine Total Phosp- 
horus in Soils” (Soil Sci. Amer. J„ 1988: 1301-1304). Su¬ 
ponga que se analiza una muestra de 11 especímenes de 
suelo, cada uno con un contenido de fósforo verdadero 
de 548 mg/kg, con el nuevo método. La media y desviación 
estándar muéstrales resultantes del nivel de fósforo son 587 
y 10, respectivamente. 

a. ¿Existe evidencia de que el nivel de fósforo medio re¬ 
portado por el nuevo método difiere significativamente 
del valor verdadero de 548 mg/kg? Use a = 0.05. 

b. ¿Qué suposiciones debe hacer para que la prueba de la 
parte (a) sea apropiada? 

68. El artículo “Orchard Floor Management Utilizing Soil Ap¬ 
plied Coal Dust for Frost Protection” ( Agri. and Forest Me- 
teorology, 1988: 71-82) reporta los siguientes valores de 
flujo de calor a través del suelo de ocho solares cubiertos 
con polvo de hulla. 

34.7 35.4 34.7 37.7 32.5 28.0 18.4 24.9 

El flujo de calor medio a través del suelo en solares cubiertos 
sólo con césped es de 29.0. Suponiendo que la distribución 
del flujo de calor es aproximadamente normal, ¿sugieren los 
datos que el polvo de hulla es eficaz para incrementar el flujo 
medio de calor sobre el del césped? Pruebe las hipótesis 
apropiadas con a = 0.05. 


69 . El artículo “Caffeine Knowledge Attitudes, and Consump- 
tion in Adult Women” (J. ofNutrition Educ., 1992: 179-184) 
reporta los siguientes datos sobre consumo diario de cafeína 
con una muestra de mujeres adultas n = 47, x = 215 mg, 
i = 235 mg y rango = 5-1176. 

a. ¿Parece plausible que la distribución de la población de 
consumo diario de cafeína sea normal? ¿Es necesario 
suponer una distribución de población normal para pro¬ 
bar hipótesis por lo que se refiere al valor del consumo 
medio de la población? Explique su razonamiento. 

b. Suponga que previamente se creía que el consumo me¬ 
dio era cuando mucho de 200 mg. ¿Contradicen los da¬ 
tos dados esta creencia previa? Pruebe las hipótesis 
apropiadas a nivel de significación de 0.10 e incluya un 
valor P en su análisis. 

70. Los datos de salida adjuntos se obtuvieron cuando se utili¬ 
zó MINITAB para probar las hipótesis apropiadas con res¬ 
pecto al tiempo de activación promedio verdadero con base 
en los datos del ejercicio 57. Use esta información para lle¬ 
gar a una conclusión a un nivel de significación de 0.05 y 
también a un nivel de 0.01. 

TEST OF MU = 25.000 VS MU G.T. 25.000 

N MEAN STDEV SE MEAN T P VALUE 

time 13 27.923 5.619 1.559 1.88 0.043 

71. Se supone que la resistencia a la ruptura promedio verdade¬ 
ra de aislantes de cerámica de un cierto tipo es por lo me¬ 
nos de 10 lb/pulg 2 . Se utilizará para una aplicación 
particular a menos que los datos muéstrales indiquen con¬ 
cluyentemente que esta especificación ha sido satisfecha. 
Una prueba de hipótesis con a = 0.01 tiene que basarse en 
una muestra aleatoria de diez aislantes. Suponga que la dis¬ 
tribución de resistencia a la ruptura es normal con desvia¬ 
ción estándar desconocida. 

a. Si la desviación estándar es de 0.80, ¿qué tan probable 
es que los aislantes serán juzgados satisfactorios cuando 
la resistencia a la ruptura promedio verdadera es en rea¬ 
lidad de sólo 9.5? ¿Sólo de 9.0? 

b. ¿Qué tamaño de muestra sería necesario para tener un 
75% de posibilidad de detectar que la resistencia a la 
ruptura promedio verdadera es de 9.5 cuando la desvia¬ 
ción estándar verdadera es de 0.80? 

72. Las observaciones adjuntas sobre tiempo de permanencia 
de llamas (seg) en tiras de ropa de dormir de niños tratada 
aparecieron en el artículo “An Introduction to Sorne Preci¬ 
sión and Accuracy of Measurement Problems” (J. ofTesting 
and Eval., 1982: 132-140). Suponga que se había asignado 
por mandato un tiempo de permanencia de llamas promedio 
verdadero de cuando mucho 9.75. ¿Sugieren los datos que 
esta condición no se ha cumplido? Realice una prueba apro¬ 
piada después de investigar la plausibilidad de las suposi¬ 
ciones que fundamentan su método de inferencia. 


9.85 

9.93 

9.75 

9.77 

9.67 

9.87 

9.67 

9.94 

9.85 

9.75 

9.83 

9.92 

9.74 

9.99 

9.88 

9.95 

9.95 

9.93 

9.92 

9.89 



73. La incidencia de un cierto tipo de cromosoma defectuoso en 
la población de varones adultos estadounidenses se cree que 
es de 1 en 75. Una muestra aleatoria de 800 individuos en 
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instituciones penitenciarias estadounidenses revela que 16 tie¬ 
nen tales defectos. ¿Se puede concluir que la proporción de 
incidencia de este defecto entre los prisioneros difiere de la 
proporción supuesta para toda la población de varones adul¬ 
tos? 

a. Formule y pruebe las hipótesis pertinentes con a = 0.05. 
¿Qué tipo de error podría haber cometido al llegar a una 
conclusión? 

b. ¿Qué valor P está asociado con esta prueba? Basado en 
este valor P, ¿podría H 0 ser rechazada a un nivel de sig¬ 
nificación de 0.20? 

74. En una investigación de la toxina producida por una cierta 
serpiente venenosa, un investigador preparó 26 frascos, cada 
uno con 1 g de la toxina y luego determinó la cantidad de 
antitoxina necesaria para neutralizar la toxina. Se encontró 
que la cantidad promedio muestral de antitoxina necesaria 
era de 1.89 mg y la desviación estándar muestral era de 
0.42. Una investigación previa indicó que la cantidad neu¬ 
tralizante promedio verdadero fue de 1.75 mg/g de toxina. 
¿Contradicen estos datos nuevos el valor sugerido por la in¬ 
vestigación previa? Pruebe las hipótesis relevantes usando 
un valor aproximado de P. ¿Depende la validez de su análi¬ 
sis de cualquier suposición sobre la distribución de la po¬ 
blación de cantidad neutralizante? Explique 

75. La resistencia a la compresión no restringida promedio 
muestral de 45 especímenes de un tipo particular de ladrillos 
resultó ser de 3107 lb/pulg 2 y la desviación estándar mues¬ 
tral de 188. La distribución de la resistencia a la compresión 
no restringida puede ser un tanto asimétrica. ¿Indican los re¬ 
sultados fuertemente que la resistencia a la compresión no 
restringida promedio verdadera es menor que el valor de di¬ 
seño de 3200? Haga la prueba con a = 0.001. 

76. Para probar la habilidad de un mecánico automotriz de 
identificar problemas simples en motores, se llevó un auto¬ 
móvil con un problema de esos a 72 talleres de reparación 
diferentes. Sólo 42 de los 72 mecánicos que revisaron el 
carro identificaron correctamente el problema. ¿Indica es¬ 
to fuertemente que la proporción verdadera de mecánicos 
que pudieron identificar este problema es menor que 0.75. 
Calcule el valor P y concluya como corresponda. 

77. Cuando X¡, X 2 , . . . , X n son variables de Poisson indepen¬ 
dientes, cada una con parámetro A y n es grande, la media 
muestral X tiene aproximadamente una distribución normal 
con ¡j. = E(X) = A y a 2 = V(X) = A !n. Esto implica que 



tiene aproximadamente una distribución normal estándar. 
Para probar H a : A = A 0 , se puede reemplazar A con A 0 en la 
ecuación para Z para obtener un estadístico de prueba. Nor¬ 
malmente se prefiere este estadístico a estadístico de mues¬ 
tra grande con denominador SP'/ñ (cuando las X¡ son 
Poisson) porque está explícitamente hecho a la medida de la 
suposición de Poisson. Si el número de solicitudes de con- 
sultoría recibidas por un cierto estadístico durante una se¬ 
mana de trabajo de cinco días tiene una distribución de 
Poisson y el número total de solicitudes de consultoría du¬ 
rante un periodo de 36 semanas es de 160, ¿sugiere esto que 
el número promedio de solicitudes semanales excede de 
4.0? Haga la prueba con a = 0.02. 
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78. Un artículo en el ejemplar del 11 de noviembre de 2005 del 
Tribune de San Luis Obispo reportó que los investigadores 
que realizan compras aleatorias en tiendas Wal-Mart en 
California encontraron que los escáneres dan el precio 
equivocado 8.3% del tiempo. Suponga que esto se basó en 
200 compras. El National Institute for Standards and Tech¬ 
nology comenta que a la larga cuando mucho dos de 100 ar¬ 
tículos deberán tener precios incorrectamente escaneados. 

a. Desarrolle un procedimiento de prueba con un nivel de 
significación de (aproximadamente) 0.05 y luego reali¬ 
zar la prueba para decidir si la referencia de compara¬ 
ción del NIST no se cumple. 

b. Con el procedimiento de prueba empleado en (a), ¿cuál 
es la probabilidad de decidir que la referencia de com¬ 
paración del NIST ha sido satisfecho cuando en realidad 
la proporción de errores es de 5%? 

79. Un fabricante de tinas calientes anuncia que con su equipo 
de calefacción, se puede alcanzar una temperatura de 100°F 
en aproximadamente 15 min. Se selecciona una muestra 
aleatoria de 32 tinas y se determina el tiempo necesario pa¬ 
ra alcanzar una temperatura de 100°F con cada tina calien¬ 
te. El tiempo promedio y la desviación estándar muéstrales 
son de 17.5 y 2.2 min, respectivamente. ¿Siembran estos 
datos alguna duda sobre la afirmación de la compañía? 
Calcule el valor P y utilícelo para llegar a una conclusión al 
nivel 0.05 (suponga que la distribución del tiempo de calen¬ 
tamiento es aproximadamente normal). 

80. El capítulo 7 presentó un intervalo de confianza para la 
varianza cr 2 de una distribución de población normal. El resul¬ 
tado clave allí fue que la variable aleatoria \ 2 ~ (« ~ l)S 2 /a 2 
tiene una distribución chi cuadrada con n - 1 grados de li¬ 
bertad. Considere la hipótesis nula H 0 : a 2 = a\ (de forma 
equivalente cr = cr 0 ). Entonces cuando H a es verdadera, el es¬ 
tadístico de prueba x 2 ~ ( n ~ 1) • i > 2 /<Xq tiene una distribución 
chi cuadrada con n - 1 grados de libertad. Si la alternativa 
pertinente es H a : cr 2 > a §, rechazar H 0 si (n — 1 )s 2 /crl £ 
X 2 d a una prueba con nivel de significación a. Para garan¬ 
tizar características razonablemente uniformes en una aplica¬ 
ción particular, se desea que la desviación estándar verdadera 
del punto de ablandamiento de un cierto tipo de alquitrán de 
petróleo sea cuando mucho de 0.50°C. Se determinaron los 
puntos de ablandamiento de diez diferentes especímenes y se 
obtuvo una desviación estándar muestral de 0.58°C. ¿Contra¬ 
dice esto fuertemente la especificación de uniformidad? 
Pruebe las hipótesis apropiadas con a = 0.01. 

81. Remitiéndose al ejercicio 80, suponga que un investigador 
desea probar H 0 : cr 2 = 0.04 contra H a : cr 2 < 0.04 basado en 
una muestra de 21 observaciones. El valor calculado de 
20 í 2 /0.04 es 8.58. Ponga límites en el valor P y luego llegue 
a una conclusión al nivel 0.01. 

82. Cuando la distribución de la población es normal y n gran¬ 
de, la desviación estándar muestral S tiene aproximadamen¬ 
te una distribución normal con E(S) ~ ay V(S) ~ o 2 /(2n). 
Ya se sabe que en este caso, con cualquier n, X es normal 
con E(X) =)jl y V(X) = cr 2 /n. 

a. Suponiendo que la distribución subyacente es normal, 
¿cuál es un estimador aproximadamente insesgado del 
percentil 99 0= /j, + 2.33ct? 
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b. Cuando las X¡ son normales, se puede demostrar que X 
y S son variables aleatorias independientes (una mide 
la ubicación mientras que la otra mide la dispersión). 
Use esto para calcular V(6) y para el estimador 6 de 
la parte (a). ¿Cuál es el error estándar estimado &- g l 

c. Escriba un estadístico para probar H 0 : 0 = d 0 que tiene 
aproximadamente una distribución estándar normal cuan¬ 
do H 0 es verdadera. Si el pH del suelo está normalmen¬ 
te distribuido en una cierta región y 64 muestras de suelo 
dan x = 6.33, s = 0.16, ¿proporciona esto una fuerte 
evidencia para concluir que cuando mucho el 99% de to¬ 
das las muestras posibles tendrían un pH de menos de 
6.75? Pruebe con a = 0.01. 

83. Sean Aj, X 2 ,, X n una muestra aleatoria de una distribución 
exponencial con parámetro A. En ese caso se puede demostrar 
que 2\2,X¡ tiene una distribución chi cuadrada con v = 2 
(primero muestre que 2XX¡ tiene una distribución chi cuadra¬ 
da con v = 2) 

a. Use este hecho para obtener un estadístico de prueba y 
región de rechazo que juntos especifiquen una prueba a 
nivel a para H 0 : ¡jl = ¡jl 0 contra cada una de las tres alter¬ 
nativas comúnmente encontradas. [ Sugerencia: E(X¡) = 

/j, = 1/A, de modo que p = ¡jl 0 equivale a A = 1 /p 0 .] 

b. Suponga que se prueban diez componentes idénticos 
que tienen un tiempo exponencialmente distribuido has¬ 
ta la falla. Los tiempos de falla resultantes son 

95 16 11 3 42 71 225 64 87 123 

Use el procedimiento de prueba de la parte (a) para de¬ 
cidir si los datos sugieren fuertemente que la vida útil 

I Bibliografía 

Véanse las bibliografías al final de los capítulos 6 y 7. 


promedio verdadera es menor que el valor previamente 
afirmado de 75. 

84 . Suponga que la distribución de la población es normal con 
cr conocida. Sea y de modo que 0 < y < a. Para probar H 0 : 
p = p 0 contra H a : p # p Q , considere la prueba que recha¬ 
za «o si z — z y o z — ~z a . y , donde el estadístico de prueba 
es Z=(X- /í 0 )/(ff/Vn). 

a. Demuestre que Pferror de tipo I) = a. 

b. Deduzca una expresión para fi(p'). [ Sugerencia : Expre¬ 
se la prueba en la forma “rechazar H 0 si x S c l o £ c 2 .”] 

c. Sea A > 0. ¿Con qué valores de y (con respecto a a) se¬ 
rá /3 (/l i 0 + A) < P(fL 0 - A)? 

85 . Luego de un periodo de aprendizaje una organización reali¬ 
za un examen que debe ser pasado para ser elegible para 
membresía. Sea p = P( aprendiz seleccionada al azar pasa el 
examen). La organización desea un examen que la mayoría 
mas no todos deberá ser capaz de pasar, por lo que decide 
que p = 0.90 es deseable. Para un examen particular, las hi¬ 
pótesis pertinentes son H 0 \ p = 0.90 contra la // a : p 0.90. 
Suponga que diez personas hacen el examen y sea X = el 
número que pasa el examen. 

a. ¿Especifica la región de cola inferior (0, 1, . . . , 5) una 
prueba de nivel 0.01? 

b. Demuestre que aun cuando // a es bilateral, ninguna 
prueba de dos colas es una prueba de nivel 0.01. 

c. Trace una gráfica de [3 (//) como función de p' para esta 
prueba. ¿Es esto deseable? 
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9 Inferencias basadas 
en dos muestras 



INTRODUCCIÓN 


Los capítulos 7 y 8 presentaron intervalos de confianza (IC) y procedimientos de prue¬ 
ba de hipótesis para una sola media p, una sola proporción p y una sola varianza a 2 . 
En este capítulo se amplían estos métodos a situaciones que implican las medias, las 
proporciones y las varianzas de dos distribuciones de población diferentes. Por 
ejemplo, sea p, la dureza Rockwell promedio verdadera de especímenes de acero 
térmicamente tratados y p 2 la dureza promedio verdadera de especímenes lamina¬ 
dos en frío. Entonces es posible que un investigador desee utilizar muestras de obser¬ 
vaciones de dureza de cada tipo de acero como base para calcular una estimación de 
intervalo de /a, - ¡i 2 , la diferencia entre las dos durezas promedio verdaderas. Como 
otro ejemplo, sea p^ la proporción verdadera de celdas de níquel-cadmio manufac¬ 
turadas en las condiciones de producción actuales defectuosas a causa de cortos 
internos y sea p 2 la proporción verdadera de celdas con cortos internos producidas en 
condiciones de operación modificadas. Si el razonamiento en cuanto a las condiciones 
modificadas es reducir la proporción de celdas defectuosas, un ingeniero de calidad 
desearía utilizar información muestral para probar la hipótesis nula H 0 : p, - p 2 = 0 
(es decir, p^ = p 2 ) contra la hipótesis alternativa H a : p, - p 2 > 0 (es decir, p , > p 2 ). 
























CAPITULO 9 Inferencias basadas en dos muestras 


9.1 Pruebas z e intervalos de confianza para una diferencia 
entre dos medias de población 


Las inferencias discutidas en esta sección se refieren a una diferencia /x — ¡i 2 entre las me¬ 
dias de dos distribuciones de población diferentes. Un investigador podría, por ejemplo, de¬ 
sear probar hipótesis con respecto a la diferencia entre resistencias a la ruptura promedio 
verdaderas de dos tipos distintos de cartón corrugado. Una de esas hipótesis formularía que 
/Xi — i¿ 2 = 0, es decir, que /x¡ = ¡jl 2 . Alternativamente, puede ser apropiado estimar /a — ¡i 2 
calculando un intervalo de confianza de 95%. Tales inferencias están basadas en una muestra 
de observaciones de resistencia de cada tipo de cartón. 


Suposiciones básicas 

1. Zj, X 2 , . . ., X m es una muestra aleatoria de una población con media ¡jl { y varian- 
za cry. 

2. Y¡, Y 2 ,, Y n es una muestra aleatoria de una población con media ¡l 2 y varianza 

<4 

3. Las muestras Xy Y son independientes entre sí. 


El estimador natural de ¡jl 1 — ¡i 2 e& X — Y, la diferencia entre las medias muéstrales corres¬ 
pondientes. El estadístico de prueba resulta de estandarizar este estimador, así que se requie¬ 
ren expresiones para el valor esperado y la desviación estándar de X — Y. 


PROPOSICIÓN 


El valor esperado de X — Y es — ¡i 2 , así que X — Y es un estimador insesgado de 
/ X [ — ¡jl 2 . La desviación estándar de X — Y es 


Ox-y 



Comprobación Estos dos resultados dependen de las reglas de valor esperado y varianza 
presentados en el capítulo 5. Como el valor esperado de una diferencia es la diferencia de 
valores esperados, 

E(X - F) = E(X) - E(Y) = ii t ~ ii 2 

Como las muestras Xy Y son independientes^A y Y son cantidades independientes, así que 
la varianza de la diferencia es la suma de V(X) y V(Y)\ 

_ _ _ _ (j-2 fj 2 

V(X - Y) = V(X) + V(Y) = — + ~ 

m n 

La desviación estándar de X — Y es la raíz cuadrada de esta expresión. ■ 

Si se piensa en /x 1 — /a, como un parámetro de 0, entonces su estimador es 9 = X — Y 
con desviación estándar cr 0 - dada por la proposición. Cuando tanto ir y como cr\ tienen valores co¬ 
nocidos, el estadístico de prueba tendrá la forma (9 — valor nuloj/oy,; esta forma de un esta¬ 
dístico de prueba se utilizó en varios problemas de una muestra en el capítulo anterior. Las 
varianzas muéstrales deben ser utilizadas para estimar erg cuando cr\ y a 7 , son desconocidas. 
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Procedimientos de prueba para poblaciones normales 
con varianzas conocidas 


En los capítulos 7 y 8, el primer intervalo de confianza y procedimiento de prueba para una 
media de población /jl se basaron en la suposición de que la distribución de la población era 
normal con el valor de la varianza de la población cr 2 conocido por el investigador. Asimis¬ 
mo, primero se supone que las distribuciones de población son normales y que los valores 
tanto de a\ como de cr 2 son conocidos. En breve se presentarán situaciones en las cuales una 
o estas dos suposiciones pueden ser eximidas. 

Como las distribuciones de población son normales, tanto X como Y tienen distribuciones 
normales. Esto implica que X — Y está normalmente distribuida con valor esperado ¡jl 1 — /jl 2 y 
desviación estándar Ux-y dada en la proposición precedente. Al estandarizar X — Y se 
obtiene la variable normal estándar 


Z = 


X-Y-Ui,- fi 2 ) 



(9.1) 


En un problema de prueba de hipótesis, la hipótesis nula formulará que fi¡ — ¡i 2 tie¬ 
ne un valor específico. Si A 0 denota este valor nulo, se tiene H 0 : /x — /jl 2 = A 0 . Con frecuencia 
A 0 = 0, en cuyo caso H 0 dice que /x = ¡i 2 . Al reemplazar /x¡ — ¡± 2 en la expresión (9. 1) con 
el valor nulo A 0 se obtiene un estadístico de prueba. El estadístico de prueba Z se obtiene 
estandarizando X — Y de conformidad con la suposición de que H 0 es verdadera, así que en 
este caso tiene una distribución estándar normal. Considérese la hipótesis alternativa H, d . /i¡ 
— ¡jl 2 > A 0 . Un valor x — y que excede considerablemente de A 0 (el valor esperado de X — 
Y cuando H 0 es verdadera) proporciona evidencia en contra de H 0 y a favor de H d . Tal valor 
de x — y corresponde a un valor positivo y grande de z. Por consiguiente H 0 deberá ser re¬ 
chazada a favor de H á si z es mayor que o igual a un valor crítico apropiadamente seleccio¬ 
nado. Como el estadístico de prueba Z tiene una distribución normal estándar cuando H 0 
es verdadera, la región de rechazo de cola superior z > z a produce una prueba con nivel de 
significación (probabilidad de error de tipo I) a. Las regiones de rechazo para H, d . /i¡ — ¡± 2 
< A 0 y H d : ¡jl 1 — ¡jl 2 J= A 0 que producen pruebas con nivel de significación deseado a son 
la de cola inferior y la de dos colas, respectivamente. 



Hipótesis nula: H 0 : /x¡ — ¡jl 2 = A 0 

x — y 


Valor estadístico de prueba: z = 


/- 

+ — 

V m 

n 


Hipótesis alternativa 

Región de rechazo para prueba con nivel a 

Mi - /U > A o 

Z — Z a (cola superior) 

Mi — Mz A o 

z < ~z a (cola inferior) 

Mi - Mz * A o 

o z s z a/ 2 o z < -z al2 (dos colas) 


Como éstas son pruebas z, se calcula un valor P como se hizo para las pruebas z en el 
capítulo 8 (p. ej., valor P = 1 — <T>(z) para una prueba de cola superior). 


Un análisis de una muestra aleatoria compuesta de m = 20 especímenes de acero laminado 
en frío para determinar resistencias a la cedencia dio por resultado una resistencia prome¬ 
dio muestral de x = 29.8 klb/pulg 2 . Una segunda muestra aleatoria de n = 25 especímenes 























CAPITULO 9 Inferencias basadas en dos muestras 


Ejemplo 9.2 


de acero galvanizado bilaterales dio una resistencia promedio muestral de y = 34.7 klb/pulg 2 . 
Suponiendo que las dos distribuciones de resistencia a la cedencia son normales con ctj = 4.0 
y £t 2 = 5.0 (sugeridas por una gráfica en el artículo “Zinc-Coated Sheet Steel: An Over¬ 
View”, Automotive Engr., diciembre de 1984: 39-43), ¿indican los datos que las resistencias 
a la cedencia promedio verdaderas /a, y /a 2 son diferentes? Realice una prueba a un nivel de 
significación a = 0.01. 


1. El parámetro de interés es ¡± { — /x 2 , la diferencia entre las resistencias promedio verda¬ 
deras de los dos tipos de acero. 

2. La hipótesis nula es H 0 : ¡jl { — /i 2 = 0. 

3. La hipótesis alternativa es // a : ¡jl í — ¡i 2 A 0; si H a es verdadera, entonces /a, y /a 9 son di¬ 
ferentes. 

4. Con A 0 = 0, el valor estadístico de prueba es 


x - y 



5. La desigualdad en H á implica que la prueba es de dos colas. Con a = 0.01, a/2 = 0.005 
Y z aii == 2o.oo5 = 2-58. H 0 será rechazada si z > 2.58 o si z — —2.58. 

6. Sustituyendo m = 20, x = 29.8, crj = 16.0, n = 25, y = 34.7 y u\ = 25.0 en la 
fórmula para z se obtiene 


z = 


29.8 - 34.7 


16.0 

25.0 

J 


V 20 

25 


-4.90 

1.34 


-3.66 


Es decir, el valor observado de x — y está a más de tres desviaciones estándar por debajo 
de lo que era de esperarse si H 0 fuera verdadera. 

7. Como —3.66 < —2.58, z queda en la cola inferior de la región de rechazo, H 0 es por 
consiguiente rechazada al nivel 0.01 en favor de la conclusión de que ¿a¡ A /a 9 . Los 
datos muéstrales sugieren fuertemente que la resistencia a la cedencia promedio 
verdadera de acero laminado en frío difiere de la de acero galvanizado. El valor P con 
esta prueba de dos colas es 2(1 — <t>(3.66)) — 2(1 — 1) = 0, de modo que H 0 debe ser 
rechazada a cualquier nivel de significación razonable. ■ 


Utilización de una comparación para identificar causalidad 

A los investigadores a menudo les interesa comparar o los efectos de dos tratamientos dife¬ 
rentes en una respuesta o la respuesta después de un tratamiento con la respuesta después 
de ningún tratamiento (tratamiento vs. control). Si los individuos u objetos que van a ser uti¬ 
lizados en la comparación no son asignados por los investigadores a las dos diferentes con¬ 
diciones, se dice que el estudio es observacional. La dificultad de sacar conclusiones 
basadas en un estudio observacional es que aunque el análisis estadístico puede indicar una 
diferencia significativa de respuesta entre los dos grupos, la diferencia puede deberse a al¬ 
gunos factores subyacentes que no habían sido controlados en lugar de ser el resultado de 
cualquier diferencia en los tratamientos. 

Una carta que apareció en el Journal ofthe American Medical Association (19 de mayo de 
1978) reporta que de 215 médicos que se graduaron en Harvard y murieron entre noviembre 
de 1974 y octubre de 1977, 125 en servicio de tiempo completo vivieron un promedio de 48.9 
años después de su graduación, en tanto que 90 con afiliaciones académicas vivieron un 
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promedio de 43.2 años después de su graduación. ¿Sugieren estos datos que la vida media 
después de la graduación de doctores en práctica completa excede la vida media de aquellos 
que tienen afiliación académica (de ser así, aquellos estudiantes que se “mueren por obtener 
una afiliación académica” pueden estar más cerca de la verdad de lo que realmente piensan, 
en otras palabras, es “publicar o perecer” realmente “publicar o perecer”)? 

Sea el número promedio verdadero de años vividos después de la graduación de 
médicos en práctica completa y /jl 2 la misma cantidad para los médicos con afiliaciones aca¬ 
démicas. Suponga que los 125 y los 90 médicos son muestras aleatorias de las poblaciones 1 
y 2, respectivamente (lo cual puede no ser razonable si hay razón para creer que los graduados 
de Harvard poseen características especiales que los diferencia de todos los demás médicos, en 
este caso las inferencias se limitarían sólo a las “poblaciones Harvard”). La carta de donde se 
tomaron los datos no dio información sobre varianzas, de modo que como ilustración supón¬ 
gase que a l = 14.6 y cr 2 = 14.4. Las hipótesis son H 0 : ¡i l — /jl 2 = 0 contra H ñ : ¡l 1 — ¡x 2 > 0, 
de modo que A 0 es cero. El valor calculado del estadístico de prueba es 


48.9 - 43.2 


5.70 


= 2.85 



(14.6) 2 (14.4) 2 Vi.70 + 2.30 

125 90 


El valor P para una prueba de cola superior es 1 — €>(2.85) = 0.0022. A un nivel de signi¬ 
ficación de 0.01, H 0 es rechazada (porque a > valor P) a favor de la conclusión de que 
¿tj — ¡x 2 > 0 (¿i > /x 2 ). Esto es compatible con la información reportada en la carta. 

Estos datos se derivaron de un estudio observacional retrospectivo; el investigador 
no comenzó seleccionando una muestra de doctores y asignando algunos al tratamiento de 
“afiliación académica” y a los demás al tratamiento de “práctica de tiempo completo”, sino 
que en su lugar identificó miembros de los dos grupos reflexionando (¡mediante obitua¬ 
rios!) hasta observando registros pasados. ¿Puede ser el resultado estadísticamente signifi¬ 
cativo atribuido en realidad a una diferencia en el tipo de práctica médica después de la 
graduación, o existe algún otro factor subyacente (p. ej., edad al momento de la gradua¬ 
ción, regímenes de ejercicio, etc.) que pudieran proporcionar también una explicación fac¬ 
tible para la diferencia? Se han utilizado estudios observacionales para argumentar en 
cuanto a un vínculo causal entre el tabaquismo y el cáncer de pulmón. Existen muchos es¬ 
tudios que demuestran que la incidencia de cáncer de pulmón es significativamente más al¬ 
ta entre fumadores que entre no fumadores. No obstante, los individuos habían decidido si 
convertirse en fumadores mucho antes de que los investigadores aparecieran en la escena 
y factores para tomar esta decisión pueden haber desempeñado un rol causal en la apari¬ 
ción de cáncer de pulmón. ■ 

Cuando investigadores asignan sujetos a los dos tratamientos de una manera aleatoria 
se obtiene un experimento controlado aleatorizado. Cuando se observa significación es¬ 
tadística en semejante experimento, el investigador y otras partes interesadas tendrán más 
confianza en la conclusión de que la diferencia en la respuesta ha sido provocada por una 
diferencia en los tratamientos. Un ejemplo muy famoso de este tipo de experimento y con¬ 
clusión es el experimento de la vacuna Salk contra la polio descrito en la sección 9.4. Estos 
temas son discutidos con mayor amplitud en los libros (no matemáticos) de Moore y de 
Freedman y colaboradores, incluidos en las referencias del capítulo 1. 


/3 y opción de tamaño de muestra 


La probabilidad de un error de tipo II es fácil de calcular cuando ambas distribuciones de 
población son normales con valores conocidos de y cr 2 . Considérese el caso en el cual la 
hipótesis alternativa es // a : ¿i, — ¡i 2 > A 0 . Sea A' un valor de /i, — ¡x-, que excede A 0 (un 
valor con el cual H 0 es falsa). La región de rechazo de cola superior z > z n puede ser 
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reexpresada en la forma x — y > A 0 + z a <Jx y- Por consiguiente la probabilidad de un error 
de tipo II cuando /i l — ¡jl 2 = A' es 

/3(A') = Pino rechazar H 0 cuando /i, — /x 2 = A') 

= P(X — Y < A 0 + z a <Jx-Y cuando ¡jl 1 — ¡jl 2 = A') 

Cuando ¿i, — ¡jl 2 = A', X — Y está normalmente distribuida con valor medio A' y desvia¬ 
ción estándar cr^_f (la misma desviación estándar como cuando H 0 es verdadera); con es¬ 
tos valores para estandarizar la desigualdad entre paréntesis se obtiene ¡3. 


Hipótesis alternativa 

Mi _ P-2 ^ A 0 

P\ ~ Pi< A o 

H d : Mi - Mi * A o 
donde cr = = 


/3(A') = P(error de tipo II cuando ^ - ¡j, 2 = A') 



$1 


Z a/2 


V {cr\lm) + (o-j/n) 



O 


~ Z a!2 



Ejemplo 9.3 

(continuación 
del ejemplo 
9.1) 


Suponga que cuando /i, y ¡jl 2 (las resistencias a la cedencia promedio verdaderas de los dos 
tipos de acero) difieren cuando mucho en 5, la probabilidad de detectar tal alejamiento de 
H 0 debe ser de 0.90. ¿Satisface esta condición una prueba a nivel 0.01 con tamaños de mues¬ 
tra m — 20 y n = 25? El valor de cr con estos tamaños de muestra (el denominador de z) se 
calculó previamente como 1.34. La probabilidad de un error de tipo II con la prueba a nivel 
0.01 de dos colas cuando ¡l x — ¡x 2 = A' = 5 es 

« 5) - T 58 - ttt) - n- 2 58 - ttt) 

= $(-1.15) - $(-6.31) = 0.1251 


Es fácil verificar que también /3(—5) = 0.1251 (porque la región de rechazo es simétrica). 
Por consiguiente, la probabilidad de detectar tal alejamiento es 1 — ¡3( 5) = 0.8749. Como 
este valor es un poco menor que 0.9, se deberán utilizar tamaños de muestra un poco más 
grandes. ■ 


Como en el capítulo 8, se pueden determinar tamaños de muestra m y n que satisfagan 
tanto P(error de tipo I) = un a especificado y /-Terror de tipo II cuando jjL¡ — fi 2 = A') = 
una f3 especificada. Para una prueba de cola superior, la igualación de la expresión previa 
para f3( A') al valor especificado de ¡3 da 

£Í + £i = (A' ~ A Q ) 2 
m n (z n 4- z p ) 2 

Cuando los dos tamaños de muestra son iguales, esta ecuación da 


m = n = 


{a\ + a 2 2 )(z a + z B ) 2 
(A' - A 0 ) 2 



Estas expresiones también son correctas para una prueba de cola inferior, en tanto a es 
reemplazada por a/2 para una prueba de dos colas. 
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Pruebas con muestra grande 

Las suposiciones de distribuciones de población normal y los valores conocidos de £r¡ y cr 2 
son innecesarias cuando ambos tamaños de muestra son grandes. En este caso, el teorema del 
límite central garantiza que X — Y tenga de manera aproximada una distribución normal in¬ 
dependientemente de las distribuciones de población subyacentes. Además, con S¡ y S 2 en 
lugar de crj y a\ en la expresión (9.1) se obtiene una variable cuya distribución es aproxi¬ 
madamente normal estándar: 

X ~ Y - ( Ml - fi 2 ) 

[Wjñ 

\ m n 


Al reemplazar /i¡ — ¡jl 2 con A 0 se obtiene un estadístico de prueba con muestra grande, 
el valor esperado de X — Y cuando H 0 es verdadera. Este estadístico Z tiene aproximada¬ 
mente una distribución normal estándar cuando H 0 es verdadera. Si se utilizan valores críticos 
Z como antes se obtienen pruebas al nivel a. 

El uso del valor estadístico de prueba 

x-y- A 0 



junto con las regiones de rechazo de colas superior, inferior y de dos colas antes formu¬ 
ladas basadas en valores críticos z da pruebas con muestra grande cuyos niveles de 
significación son aproximadamente a. Estas pruebas son apropiadas de modo normal si 
tanto m > 40 como n > 40. Un valor P se calcula en forma exacta como se hizo en 
pruebas z previas. 



Ejemplo 9.4 Al seleccionar concreto azufrado para la construcción de carreteras en regiones que experi¬ 
mentan heladas intensas, es importante que el concreto seleccionado tenga un valor bajo de 
conductividad térmica para reducir al mínimo los daños subsiguientes provocados por cam¬ 
bios de temperatura. Suponga que se están considerando dos tipos de concreto, uno agrega¬ 
do escalonado y uno agregado sin finos, para una carretera. La tabla 9.1 resume datos de un 
experimento realizado para comparar los dos tipos de concreto. ¿Sugiere esta información 
que la conductividad promedio verdadera del concreto graduado excede la del concreto sin 
finos? Realice una prueba con a = 0.01. 


Tabla 9.1 Datos para el ejemplo 9.4 


Tipo 

Tamaño de muestra 

Conductivad promedio muestral 

Desviación estándar muestral 

Graduado 

42 

0.486 

0.187 

Sin finos 

42 

0.359 

0.158 


Sean 

escalonado 

Mi — Pn 


¡i l y fi 2 la conductividad térmica promedio verdadera del concreto agregado 
y sin finos, respectivamente. Las dos hipótesis son H 0 : = 0 contra f/ a : 

0 será rechazada si z > z 001 = 2.33. Se calcula 


z = 


0.486 - 0.359 = 0-127 

I (0.187) 2 | (0.158) 2 0.0378 

42 42 


= 3.36 
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Como 3.36 > 2.33, H 0 es rechazada a un nivel de significación de 0.01. Alternativamente, 
el valor P para una prueba z de cola superior es 

Valor P = 1 - $(-) = 1 - $(3.36) = 0.0004 

H 0 deberá ser rechazada no sólo para una prueba con a = 0.01 sino también con a = 0.001 
o cualquier nivel a que exceda de 0.0004. Los datos sustentan fuertemente la conclusión de 
que la conductividad térmica promedio verdadera del concreto graduado sí excede la del 
concreto sin finos. ■ 


Intervalos de confianza para ¡i^ - ¡jl 2 

Cuando ambas distribuciones de población son normales la estandarización de X — Y da 
una variable aleatoria Z con distribución normal estándar. Como el área bajo la curva z entre 
—Zaj 2 y Zd 2 es 1 — a, se desprende que 


P 


Z,a/2 


< 


X-Y-U U-! - /u) 



0-2 

\ m 

+ 

n 



= 1 — a 


La manipulación de las desigualdades entre paréntesis para aislar ju¡ — ¡l 2 da la formula¬ 
ción de probabilidad equivalente 


_ 

Icr \ <r\ — — 

\(t\ (t\ 

Y - Z*I2 J 

'— + -=< Mi -/a 2 CZ-L + z a/2 I 


m n y 

m n 


Esto implica que un intervalo de confianza de 100(1 — a)% para /j.¡ — ¡jl 2 tiene un límite 
inferior x — y — z a/2 • (ry y y uno superior i — y + z a/2 ■ ¡7, donde ay y es la expresión 

de la raíz cuadrada. Este intervalo es un caso especial de la fórmula general 6 ± z a/2 ■ erg. 

Si tanto m como n son grandes, el teorema del límite central implica que este intervalo 
es válido incluso sin la suposición de población normal; en este caso, el intervalo de confian¬ 
za es aproximadamente de 100(1 — a)%. Además, el uso de las varianzas muéstrales ,S'f y S\ en 
la variable estandarizada Z da un intervalo válido en el cual s\ y s \ reemplazan a a] y (t\. 


Siempre que m y n son grandes, un intervalo de confianza para ¡i i — p 2 con un nivel 
de confianza de aproximadamente 100(1 — a)% es 


y ± Z a n 


m 


+ 


J 2 

n 


donde — da el límite inferior y + el límite superior del intervalo. Un límite de con¬ 
fianza superior o inferior también puede ser calculado reteniendo el signo apropiado 
(+ o -) reemplazando z^ con Z a . 



Una regla empírica estándar para caracterizar tamaños de muestra tan grandes es m > 40 y 
n > 40. 

Ejemplo 9.5 Un experimento realizado para estudiar varias características de pernos de anclaje arrojó 78 
observaciones de resistencia al esfuerzo cortante (klb) de pernos de 3/8 pulg de diámetro y 
88 observaciones de resistencia de pernos de — pulg de diámetro. A continuación se dan 
cantidades obtenidas con MINITAB y en la figura 9.1 se presenta una gráfica de caja com¬ 
parativa. Los tamaños de muestra, las medias y las desviaciones estándar muéstrales con- 
cuerdan con los valores dados en el artículo “Ultimate Load Capacities of Expansión 
Anchor Bolts”, ( J. Energy Engr., 1993: 139-158). Los resúmenes sugieren que la diferencia 
principal entre las dos muestras es donde están centradas. 
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Diam 


N 

Media 

Mediana 

MediaTr 

DesvEs 

MediaSE 

variable 

3/8 

78 

4.250 

4.230 

4.238 

1.300 

0.147 

Diam 


Mín 

Máx 

Q1 

Q3 



variable 

3/8 

1.634 

7.327 

3.389 

5.075 



Diam 


N 

Media 

Mediana 

MediaTr 

DesvEs 

MediaSE 

variable 

1/2 

88 

7.140 

7.113 

7.150 

1.680 

0.179 

Diam 


Mín 

Máx 

Q1 

Q3 



variable 

1/2 

2.450 

11.343 

5.965 

8.447 




2 - 


& 

v 


1 - 



resistencia 


Figura 9.1 Gráfica de caja comparativa de los datos de resistencia al esfuerzo cortante. 




O 


Calcule ahora un intervalo de confianza para la diferencia entre la resistencia al esfuerzo 
cortante promedio verdadera de pernos de 3/8 pulg (¡jl¡) y la resistencia al esfuerzo cortan¬ 
te promedio verdadera de pernos de 1/2 pulg (¡± 2 ) con un nivel de confianza de 95%: 


4.25 - 7.14 ± (1.96) 


' (1.30) 2 (1.68) 2 


78 


88 


-2.89 ± (1.96X0.2318) 


= -2.89 ± 0.45 = (-3.34, -2.44) 


Es decir, con confianza de 95%, —3.34 < ¡jl 1 — ¡jl 2 < —2.44. Por consiguiente se puede 
estar altamente confiado en que la resistencia al esfuerzo cortante verdadera de los pernos 
de 1/2 pulg excede la de los pernos de 3/8 pulg entre 2.44 klb y 3.34 klb. Obsérvese que si 
se redesignan de modo que ¡jl 1 se refiera a pernos de 1/2 pulg y ¡jl 2 a pernos de 3/8 pulg, el 
intervalo de confianza ahora está centrado en +2.89 y el valor de 0.45 se sigue restando y 
sumando para obtener los límites de confianza. El intervalo resultante es (2.44, 3.34) y la 
interpretación es idéntica a la del intervalo previamente calculado. ■ 

Si las varianzas de <j\ y tr 2 son por lo menos aproximadamente conocidas y el inves¬ 
tigador utiliza tamaños de muestra iguales, entonces el tamaño de muestra común n que da 
un intervalo de 100(1 — a)% de ancho w es 

= 4 4/2 (oj + Op 


la que normalmente tiene que ser redondeada a un entero. 
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EJERCICIOS Sección 9.1 (1-16) 

i_ 


1. Un artículo que apareció en el ejemplar de noviembre de 
1983 del Consumer Reports comparó varios tipos de bate¬ 
rías. Las duraciones promedio de baterías AA alcalinas Du- 
racell y alcalinas Eveready Energizer se dieron como 4.1 
horas y 4.5 horas, respectivamente. Suponga que éstas son 
las duraciones promedio de la población. 

a. Sea X la duración promedio muestral de 100 baterías Du- 
racell y Y la duración promedio muestral de 100 baterías 
Eveready. ¿Cuál es el valor medio X — Y (es decir, donde 
está centrada la distribución de X — E)? ¿Cómo depen¬ 
de su respuesta de los tamaños de muestra especificados? 

b. Suponga que la desviación estándar de la población de 
duración es de 1.8 horas para baterías Duracell y de 2.0 
horas para baterías Eveready. Con los tamaños de mues¬ 
tra dados en el inciso a), ¿cuál es la varianza del estadís¬ 
tico X — Y y cuál es su desviación estándar? 

c. Con los tamaños de muestra dados en el inciso a) trace 
la curva de distribución aproximada de X — Y (incluya 
una escala de medición sobre el eje horizontal). ¿Sería la 
forma de la curva necesariamente la misma con tamaños 
de muestra de 10 baterías de cada tipo? Explique. 

2. Sean ¿q y /q las duraciones de la banda de rodamiento pro¬ 
medio verdaderas de dos marcas competidoras de neumáti¬ 
cos radiales P205/65R15. Pruebe H 0 : ¿q — /q = 0 contra 
H a : ¿q — fin A 0 a un nivel 0.05 con los siguientes datos: 
m = 45, 5 = 42500, q = 2200, n = 45, y = 40400, y 
q = 1900. 

3. Sea /q la duración de la banda de rodamiento promedio verda¬ 
dera de una marca premium de neumático radial P205/65R15 
y sea q, la duración de la banda de rodamiento promedio ver¬ 
dadera de una marca económica de un neumático de la misma 
medida. Pruebe H 0 : /q — /q = 5000 contra H¿. /q — /q > 
5000 a un nivel 0.01 con los siguientes datos: m = 45, x = 
42500, q = 2200, n = 45, y = 36800, ys 2 = 1500. 

4. a. Use los datos del ejercicio 2 para calcular un intervalo 

de 95% para /q — ¿q. ¿Sugiere el intervalo resultante 
que ¿q — yu,, ha sido estimado con precisión? 

b. Use los datos del ejercicio 3 para calcular un límite de 
confianza superior de 95% para /q — /q. 

5. Las personas que padecen el síndrome de Reynaud están pro¬ 
pensas a sufrir un deterioro repentino de la circulación sanguí¬ 
nea en los dedos de las manos y de los pies. En un experimento 
para estudiar el grado de este deterioro, cada uno de los suje¬ 
tos sumergió un dedo índice en agua y se midió la producción 
de calor resultante (cal/cm 2 /min). Con m = 10 sujetos con el 
síndrome, la producción de calor promedio fue x = 0.64, y con 
n = 10 sin el síndrome, la producción promedio fue de 2.05. 
Sean /q y /q las producciones de calor promedio verdaderas 
de los tipos de sujetos. Suponga que las dos distribuciones de 
producción de calor son normales con (q = 0.2 y cr 2 = 0.4. 

a. Considere probar H 0 : /q — ¿i, = — 1.0 contra /í a : /q — 
¿q < —1.0 a un nivel 0.01. Describa en palabras qué di¬ 
ce H d y luego realice la prueba. 

b. Calcule el valor P para el valor de Z obtenido en el inciso a) 


c. ¿Cuál es la probabilidad de un error de tipo II cuando la 
diferencia entre /q y /q es /q — /q = —1.2? 

d. Suponiendo que m = n, ¿qué tamaños de muestra se 
requieren para asegurar que fi = 0.1 cuando ¿q — /q 
= - 1 . 2 ? 

6. Un experimento para comparar la resistencia de adhesión a la 
tensión de un mortero modificado con un polímero de látex 
(mortero de cemento Portland al cual se le agregan emulsio¬ 
nes de polímero de látex durante la mezcla con la de un mor¬ 
tero no modificado dio por resultado x = 18.12 kgf/cm 2 para 
el mortero modificado (m = 40) y y = 16.87 kgf/cm 2 para el 
mortero no modificado (n = 32). Sean /q y /q las resisten¬ 
cias de adhesión a la tensión promedio verdaderas para los 
morteros modificado y no modificado, respectivamente. Su¬ 
ponga que ambas distribuciones de la resistencia de adhesión 
son normales. 

a. Suponiendo que tr¡ = 1.6 y tq = 1.4, pruebe H a \ 
p ,i — ¿q = 0 contra F/ a : /q — /q > 0 a un nivel 0.01. 

b. Calcule la probabilidad de un error de tipo II para la 
prueba del inciso a) cuando ¿q — /q = 1. 

c. Suponga que el investigador decidió utilizar una prueba 
a un nivel 0.05 y deseaba y8 = 0.10 cuando /q — /q = 1. 
Si m = 40, ¿qué valor de n es necesario? 

d. ¿Cómo cambiaría el análisis y conclusión del inciso a) si 
<q y tq fueran desconocidas pero q = 1.6 y q = 1.4? 

7. ¿Se aburren más fácil los estudiantes universitarios que sus 
contrapartes femeninas? Esta pregunta se examinó en el ar¬ 
tículo “Boredom in Young Adults-Gender and Cultural 
Comparisons” (J. of Cross-Cultural Psych., 1991: 209-223). 
Los autores aplicaron una escala llamada Boredom Proneness 
Scale a 97 estudiantes universitarios y a 148 estudiantes univer¬ 
sitarias. ¿Apoyan los datos adjuntos la hipótesis de investiga¬ 
ción de que la calificación media de tendencia al aburrimiento 
es más alta para hombres que para mujeres? Pruebe las hipóte¬ 
sis apropiadas con nivel de significación de 0.05. 



Tamaño de 

Media 

DE 

Género 

muestra 

muestral 

muestral 

Hombres 

97 

10.40 

4.83 

Mujeres 

148 

9.26 

4.68 

Se realizaron pruebas de resistencia a la tensión en dos gra¬ 
dos diferentes de alambrón (“Fluidized Bed Patenting of 

Wire Rods” 

, Wire 7., junio de 1977: 56-61) y se obtuvieron 

los datos adjuntos. 





Media 



Tamaño de 

muestral 

DE 

Grado 

muestra 

(kg/mm 2 ) 

muestral 

AISI 1064 

m = 129 

3c = 107.6 

q = 1.3 

AISI 1078 

n = 129 

y = 123.6 

q = 2.0 


a. ¿Proporcionan los datos evidencia precisa para concluir 
que la resistencia promedio verdadera del grado 1078 

























c9_p325-368.qxd 


3/12/08 4:21 AM Page 335 



9.1 Pruebas ze intervalos 

excede la del grado 1064 en más de 10 kg/mm 2 ? Pruebe 
las hipótesis apropiadas con el método del valor P. 

b. Estime la diferencia entre resistencias promedio verda¬ 
deras para los dos grados en una forma que proporcione 
información sobre precisión y confiabilidad. 

9. El artículo “Evaluation of a Ventilation Strategy to Prevent 
Barotrauma in Patients at High Risk for Acute Respiratory 
Distress Syndrome” (New Engl. J. ofMed., 1998: 355-358) 
reportó sobre un experimento en el cual 120 pacientes con 
características clínicas similares fueron divididos al azar en 
un grupo de control y un grupo de tratamiento, cada uno 
compuesto de 60 pacientes. La permanencia en la unidad de 
cuidados intensivos media y la desviación estándar mués¬ 
trales para el grupo de tratamiento fueron 19.9 y 39.1, res¬ 
pectivamente, en tanto que estos valores para el grupo de 
control fueron 13.7 y 15.8. 

a. Calcule una estimación puntual de la diferencia entre la 
permanencia en la unidad de cuidados intensivos prome¬ 
dio verdadera para los grupos de tratamiento y control. 
¿Sugiere esta estimación que existe una diferencia signi¬ 
ficativa entre las permanencias promedio verdaderas en 
las dos condiciones? 

b. Responda la pregunta planteada en el inciso a) realizan¬ 
do una prueba formal de hipótesis. ¿Es diferente el re¬ 
sultado de lo que había conjeturado en el inciso a)? 

c. ¿Parece que la permanencia en la unidad de cuidados 
intensivos de pacientes a los que se les administró tra¬ 
tamiento de ventilación está normalmente distribuida? 
Explique su razonamiento. 

d. Estime el tiempo de permanencia promedio verdadero 
de pacientes a los que se les administró tratamiento de 
ventilación en una forma que dé información sobre pre¬ 
cisión y confiabilidad. 

10. Se realizó un experimento para comparar la tenacidad a la frac¬ 
tura de acero maraging de alta pureza con 18% de níquel con 
acero de pureza comercial del mismo tipo ( Corrosión Science, 
1971: 723-736). Con m = 32 especímenes la tenacidad pro¬ 
medio muestral fue x = 65.6 para el acero de alta pureza, en 
tanto que para n = 38 especímenes de acero comercial 
y = 59.8. Como el acero de alta pureza es más caro, su uso en 
ciertas aplicaciones se justifica sólo si su tenacidad a la fractu¬ 
ra supera la del acero de pureza comercial en más de 5. Supon¬ 
ga que ambas distribuciones de tenacidad son normales. 

a. Suponiendo que <r l = 1.2 y cr, = 1.1, pruebe las hipóte¬ 
sis pertinentes con a = 0.001. 

b. Calcule /3 para la prueba realizada en el inciso a) cuan¬ 
do yu,¡ — /jl 2 = 6. 

11. Se determinó el nivel de plomo en la sangre con una mues¬ 
tra de 152 trabajadores de desechos peligrosos de 20 a 30 
años de edad y también con una muestra de 86 trabajadoras 
y el resultado fue una media ± un error estándar de 5.5 ± 0.3 
para los hombres y de 3.8 ± 0.2 para las mujeres (“Tempo¬ 
ral Changes in Blood Lead Levels of Hazardous Waste Wor- 
kers in New Jersey, 1984-1987”, Environ. Monitoring and 
Assessment, 1993: 99-107). Estime la diferencia entre niveles 
de plomo en sangre promedio verdaderos para trabajadores 
y trabajadoras en una forma que proporcione información 
sobre confiabilidad y precisión. 
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12. La tabla adjunta contiene datos sobre resistencia a la com¬ 
presión (N/mm 2 ) de especímenes de concreto hechos con 
una mezcla de cenizas combustibles pulverizadas (“A Study 
of Twenty-Five-Year-Old Pulverized Fuel Ash Concrete 
Used in Foundation Structures”. Proc. Inst. Civ. Engrs., 
marzo de 1985: 149-165): 

Edad Tamaño Media DE 

(días) muestral muestral muestral 

7 68 26.99 4.89 

28 74 35.76 6.43 

Calcule e interprete un intervalo de confianza de 99% para 
la diferencia entre resistencia a 7 días promedio verdadera y 
resistencia a 28 días promedio verdadera. 

13. Un ingeniero mecánico desea comparar las propiedades de 
resistencia de vigas de acero con vigas similares hechas 
de una aleación particular. Se probará el mismo número de 
vigas, n, de cada tipo. Cada viga se colocará en posición ho¬ 
rizontal con un apoyo en cada extremo y aplicará una fuer¬ 
za de 2500 Ib en el centro y se medirá la deflexión. Por 
experiencias pasadas con las mismas vigas, el ingeniero de¬ 
sea suponer que la desviación estándar verdadera de la 
deflexión de ambos tipos de viga es de 0.05 pulg. Como 
la aleación es más cara, el ingeniero desea probar a un nivel 
de 0.01 si su deflexión promedio es más pequeña que la de 
la viga de acero. ¿Qué valor de n es apropiado si la proba¬ 
bilidad de error de tipo II deseado es de 0.05 cuando la di¬ 
ferencia de deflexión promedio verdadera favorece la 
aleación por 0.04 pulgadas? 

14. Se determinó el nivel de actividad de oxidasa monoamina 
(MAO, por su siglas en inglés) en plaquetas sanguíneas 
(nm/mg proteína/h) para cada individuo en una muestra 
de 43 esquizofrénicos crónicos y el resultado fue x = 2.69 
y .i, = 2.30, así como también para 45 sujetos normales y 
el resultado fue y = 6.35 y s 2 = 4.03. ¿Sugieren fuertemen¬ 
te estos datos que la actividad de MAO promedio verdade¬ 
ra en sujetos normales es más de dos veces que el nivel de 
actividad en esquizofrénicos? Derive un procedimiento 
de prueba y realice una prueba con a = 0.01. [ Sugerencia : 
H 0 y 7/ a en este caso tienen una forma diferente de los tres 
casos estándar. Si ¿q y ¿i, se refieren a la actividad de MAO 
promedio verdadera para sujetos esquizofrénicos y norma¬ 
les, respectivamente, considere el parámetro 0 = 2p,¡ — ¿i 2 . 
Escriba H 0 y 7/ a en función de 6, estime 6 y derive erg (“Re- 
duced Monoamine Oxidase Activity in Blood Platelets from 
Schizophrenic Patients”, Nature, 28 de julio, 1972: 225- 
226).] 

15. a. Demuestre que para la prueba de cola superior con oy y 

a 2 conocidas a medida que in o n se incrementa, /3 dis¬ 
minuye cuando ¡ji 1 — > A 0 . 

b. En el caso de tamaños de muestra iguales (m = n) y a 
fijo, ¿qué le sucede al tamaño de muestra necesario n a 
medida que f) disminuye, donde ¡3 es la probabilidad de 
error de tipo II deseada con una alternativa fija? 

16. Para decidir si dos tipos diferentes de acero tienen los mis¬ 
mos valores de tenacidad a la fractura promedio verdaderos, 
se probaron n especímenes de cada tipo y se obtuvieron los 
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siguientes resultados: 

Tipo Promedio muestral DE muestra! 

1 60.1 1.0 

2 59.9 1.0 

Calcule el valor P para la prueba z con dos muestras apro¬ 


piadas, suponiendo que los datos se basaron en n — 100. 
Luego repita el cálculo con n — 400. ¿Es el valor P peque¬ 
ño con n = 400 indicativo de una diferencia que tenga sig¬ 
nificación práctica? Se sentiría satisfecho con sólo el 
reporte del valor P? Comente brevemente. 


9.2 Prueba t con dos muestras e intervalo de confianza 


Normalmente un investigador no conoce los valores de las varianzas de la población. En la 
sección previa, se ilustró por lo que se refiere a muestras grandes el uso de un procedimien¬ 
to de prueba y un intervalo de confianza en el cual se utilizaron las varianzas muéstrales en 
lugar de las varianzas de la población. En realidad, con muestras grandes, el teorema del lí¬ 
mite central permite utilizar estos métodos incluso cuando las dos poblaciones de interés no 
son normales. 

No obstante, existen muchos problemas en los cuales por lo menos un tamaño de 
muestra es pequeño y los valores de la varianza de la población son desconocidos. Sin el 
teorema del límite central, se procede haciendo suposiciones específicas sobre las distribu¬ 
ciones de población subyacentes. El uso de procedimientos inferenciales que se desprenden 
de estas suposiciones se limita entonces a situaciones en las que las suposiciones se satisfa¬ 
cen por lo menos de forma aproximada. 


SUPOSICIONES 


Ambas poblaciones son normales, de modo que Aj, X 2 , . . . , X m es una muestra alea¬ 
toria de una distribución normal y también lo es Tj, . . . , Y n (con las X y Y indepen¬ 
dientes entre sí). La factibilidad de estas suposiciones puede ser juzgada 
construyendo una curva de probabilidad normal de las x¡ y otra de las y¡. 


El estadístico de prueba y la fórmula del intervalo de confianza están basados en la misma va¬ 
riable estandarizada en la sección 9.1, pero la distribución pertinente ahora es t en lugar de z. 


TEOREMA 


Cuando ambas distribuciones de población son normales, la variable estandarizada 


T = 


X-Y-(n , - /r 2 ) 



(9.2) 


tiene aproximadamente una distribución t con v grados de libertad estimado a partir 
de los datos como sigue 



(, s \/ m ) 2 (S5/77) 2 

m — 1 n — 1 


[(e^i) 2 + (es 2 ) 2 ] 2 
(e^i) 4 (es 2 ) 4 

m 1 n — 1 


donde 



(redondear v al entero más cercano hacia abajo). 



La manipulación de T en un enunciado de probabilidad para aislar fi ] — ¡jl 2 da un in¬ 
tervalo de confianza, en tanto que al reemplazar ¿i, — ¡jl 2 con el valor nulo A 0 se obtiene un 
estadístico de prueba. 
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Procedimientos fcon dos muestras 

El intervalo de confianza t con dos muestras para — ¡jl 2 con nivel de confianza 
de 100(1 — a)% es entonces _ 


y±t, 


a/2,v- 


-- + — 


Se puede calcular un límite de confianza unilateral como se describió con anterioridad. 
La prueba t con dos muestras para probar H 0 : /jl 1 — ¡a-, = A 0 es como sigue: 

x-y- A 0 


Valor estadístico de prueba: t = 


+ — 


Hipótesis alternativa 

Mi ~ M 2 > A 0 

Mi — M2 ^ ^0 
H d : fi x - /a 2 + A 0 


Región de rechazo con una prueba a nivel a aproximado 

t > t a v (cola superior) 


t > t„ 


t ~ -tal!,* ( d0S C0laS ) 


Se puede calcular un valor P como se describió en la sección 8-4 para la prueba con 
una muestra. 


El volumen de huecos en una tela afecta las propiedades de comodidad, inflamabilidad y 
aislantes. La permeabilidad de una tela se refiere a la accesibilidad de los espacios huecos 
al flujo de un gas o líquido. El artículo “The Relationship Between Porosity and Air Per- 
meability of Woven Textile Fabrics” (7. ofTesting andEval., 1997: 108-114) contiene infor¬ 
mación resumida sobre permeabilidad al aire (cm 3 /cm 2 /s) de varios tipos diferentes de tela. 
Considere los siguientes datos sobre dos tipos diferentes de tela de tejido ordinario: 


Tipo de tela 

Tamaño de muestra 

Media muestral 

Desviación estándar de muestra 

Algodón 

10 

51.71 

0.79 

Triacetato 

10 

136.14 

3.59 



Suponiendo que la distribuciones de porosidad de ambos tipos de tela son normales, calcule 
un intervalo de confianza para la diferencia entre la porosidad promedio verdadera de la tela 
de algodón y la de la tela de acetato, utilizando un intervalo de confianza de 95%. Antes de 
que se pueda seleccionar un valor crítico t apropiado, se debe determinar el número de gra¬ 
dos de libertad. 


/ 0.6241 12.8881 \z 

\ 10 + 10 j _ 1.8258 

(0.6241/10) 2 (12.8881/10) 2 “ 0.1850 

9 9 


Así pues se utiliza v = 9; la tabla A.5 del apéndice da í 00259 = 2.262. El intervalo resultante es 

12.8881 


51.71 - 136.14 ± (2.262) 


/ 0.624 1 
10 


+ = -84.43 ± 2.63 

= (-87.06, -81.80) 


10 


Con un alto grado de confianza, se puede decir que la porosidad promedio verdadera de es¬ 
pecímenes de tela de triacetato excede la de los especímenes de algodón entre 81.80 y 
87.06 cm 3 /cm 2 /s. ■ 
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El deterioro de muchas redes de tuberías municipales a través del país es una preocupación 
creciente. Una tecnología propuesta para rehabilitar las tuberías utiliza un forro flexible in¬ 
sertado en las tuberías existentes. El artículo “Effect of Welding on a High-Density Pol- 
yethylene Liner” (J. of Materials in Civil Engr., 1996: 94-100 reportó los siguientes datos 
de resistencias a la tensión (lb/pulg 2 ) de especímenes de forro cuando se utilizó cierto pro¬ 
ceso de fusión y cuando este proceso no se utilizó. 


Sin fusión 

2748 

2700 

2655 

2822 2511 





3149 

3257 

3213 

3220 2753 





m = 10 

JC = 

= 2902.8 

s l = 277.3 




Fusionado 

3027 

3356 

3359 

3297 3125 

2910 

2889 

2902 


n = 8 

y = 

3108.1 

,s 2 = 205.9 





La figura 9.2 muestra curvas de probabilidad normal generadas por MINITAB. El patrón li¬ 
neal de cada una confirma la suposición de que las dos distribuciones de resistencia a la ten¬ 
sión en ambas condiciones son normales. 


Curva de probabilidad normal 


0.999 

0.99 

0.95 

"ra 0.80 

■g 

Í 5 °- 50 

fü 

f 0 - 20 

0.05 

0.01 

0.001 


2880 2980 3080 3180 3280 3380 

fusionado 





Curva de probabilidad normal 



Ejemplo 9.7 



Figura 9.2 Curvas de probabilidad normal generadas por MINITAB con los datos de resistencia a la tensión. 


Los autores del artículo afirman que el proceso de fusión incrementó la resistencia a la 
tensión promedio. El mensaje de la gráfica comparativa de la figura 9.3 no es del todo claro. 
Realice una prueba de hipótesis para ver si los datos confirman esta conclusión. 



Resistencia 


Figura 9.3 Gráfica de caja comparativa de los datos de resistencia a la tensión. 
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1. Sea /i[ la resistencia a la tensión promedio verdadera de especímenes cuando se utiliza 
el tratamiento de no fusión y /i 2 la resistencia a la tensión promedio verdadera cuando 
se utiliza el tratamiento de fusión. 

2. H 0 : ¡jl x — /i 9 = 0 (ninguna diferencia en las resistencias a la tensión promedio verdaderas 

con los dos tratamientos). 

3. H ñ : /j. | — ¡i 2 < 0 (la resistencia a la tensión promedio verdadera del tratamiento sin fusión 

es menor que la del tratamiento de fusión, de modo que la conclusión de 
los investigadores es correcta). 

4. El valor nulo es A 0 = 0, de modo que el estadístico de prueba es 


t = 


y 


lí i + £2 

m n 


5. A continuación se calcula tanto el valor estadístico de prueba como el número de gra¬ 
dos de libertad para la prueba: 


t = 


2902.8 - 3108.1 _ -205.3 

I (277.3) 2 (205.9) 2 ~~ 113.97 

10 + 8 


= - 1.8 




Con s\lm = 7689.529 y s\/n = 5299.351, 
(7689.529 + 5299.351) 2 


(7689.529) 2 /9 + (5299.351 ) 2 /7 


168711003.7 

10581747.35 


= 15.94 


así, la prueba se basará en 15 grados de libertad. 

6 . La tabla A.8 del apéndice muestra que el área bajo la curva t con 15 grados de libertad a la 
derecha de 1.8 es 0.046, de modo que el valor P para una prueba de cola inferior también 
es 0.046. Los siguientes datos generados por MINITAB resumen todos los cálculos: 


O 


T muestreados para no fusión vs fusionada 

N Media DesvEs EE de la media 
sin fusión 10 2903 277 88 

fusionado 8 3108 206 73 

IC para mu no fusionado-mu fusionado: (-488, 38) 

Prueba T mu no fusionada = mu fusionada (vs <) : T = —1.80 P= 0.046 DF = 15 

7. Con un nivel de significación de 0.05, apenas si se puede rechazar la hipótesis nula a fa¬ 
vor de la hipótesis alternativa, lo que confirma la conclusión expresada en el artículo. 
No obstante, alguien que demande evidencia más contundente podría seleccionar a = 
0.01, un nivel con el cual H 0 no puede ser rechazada. 

Si la pregunta planteada hubiera sido si la fusión incrementó la resistencia promedio verdade¬ 
ra en más de 100 lb/pulg 2 , entonces las hipótesis pertinentes habrían sido H 0 : — /jl 2 = —100 
contra H ñ : ¡i x — ¡jl 2 < —100; es decir, el valor nulo habría sido A 0 = —100. ■ 


Procedimientos t agrupados 


De la suposición de que no sólo las dos distribuciones de población son normales sino que 
también tienen varianzas iguales (rrj = <t\), se deriva la alternativa de los procedimientos t 
con dos muestras. Es decir, las dos curvas de distribución de población se suponen norma¬ 
les con dispersiones iguales, la única diferencia entre ellas sería donde están centradas. 
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Sea cr la varianza de población común. Luego, estandarizando X — Y se obtiene 
X ~ Y - ( Ml - /x 2 ) _ X ~ Y - (/i, - /i 2 ) 


la 2 

a 2 

1 ,i l 

i\ 

/ + 

— 

Jcr-\ — 

+ ) 

v m 

n 

V y m 

n 


cuya distribución es normal estándar. Antes de que esta variable pueda ser utilizada como base 
para hacer inferencias con respecto a /i 1 — /x 2 , se debe estimar la varianza común a partir de los 
datos muéstrales. Un estimador de cr 2 es Sf, la varianza de las m observaciones en la primera 
muestra y otro es S], la varianza de la segunda muestra. Intuitivamente, se obtiene un mejor es¬ 
timador que cualquier varianza muestral individual al combinar las dos varianzas muéstrales. 
Un primer intento podría ser utilizar (ó 1 ; + Sf)/2, el promedio ordinario de las dos varianzas 
muéstrales. No obstante, si m > n, entonces la primera muestra contiene más información so¬ 
bre cr 2 que la segunda y un comentario análogo es válido si m < n. El siguiente promedio pon¬ 
derado de las dos varianzas muéstrales, llamado estimador agrupado (es decir, combinado) 
de a 1 , se ajusta a cualquier diferencia que exista entre los dos tamaños de muestra: 


m — 1 

S 2 = - 

p m + n — 


S¡ + 


n — 1 

—-V ■ S¡ 

m + n — 2 


La primera muestra contribuye con m — 1 grados de libertad a la estimación de a 2 y la se¬ 
gunda con n — 1 grados de libertad, para un total de m + n — 2 grados de libertad. La teo¬ 
ría estadística dice que si S 2 P reemplaza a o 2 en la expresión para Z, la variable estandarizada 
resultante tiene una distribución t basada en m + n — 2 grados de libertad. Del mismo mo¬ 
do que las variables estandarizadas con anterioridad se utilizaron como base para derivar in¬ 
tervalos de confianza y procedimientos de prueba, esta variable t conduce de inmediato al 
intervalo de confianza t agrupado para estimar /i, — (jl 2 y a la prueba t agrupada para pro¬ 
bar hipótesis con respecto a una diferencia entre las medias. 

En el pasado, muchos estadísticos recomendaban estos procedimientos t agrupados 
sobre los procedimientos t con dos muestras. La prueba t agrupada, por ejemplo, puede de¬ 
rivarse del principio de razón de verosimilitud, mientras que la prueba t con dos muestras no 
es una prueba de razón de verosimilitud. Además, el nivel de significación para la prueba t 
agrupada es exacta, en tanto que sólo es aproximada para la prueba t con dos muestras. Sin 
embargo, investigaciones recientes han demostrado que aunque la prueba t agrupada supe¬ 
ra por poco el desempeño de la prueba t con dos muestras (las ¡3 más pequeñas con el mis¬ 
mo nivel a) cuando cr] = cr], la primera prueba puede llevar fácilmente a conclusiones 
erróneas si se aplica cuando las varianzas son diferentes. Comentarios análogos se aplican 
al comportamiento de los dos intervalos de confianza. Es decir, los procedimientos t agru¬ 
pados no violan la suposición de varianza igual. 

Se ha sugerido que se podría realizar una prueba preliminar de H 0 : cr] = <r] y utilizar 
un procedimiento t agrupado si esta hipótesis nula no es rechazada. Desafortunadamente, la 
“prueba F' usual de varianzas iguales (sección 9.5) es bastante sensible a la suposición de 
distribuciones de población normales, mucho más que los procedimientos t. Por consiguien¬ 
te, se recomienda el método conservador de utilizar procedimientos t con dos muestras 
a menos que exista evidencia realmente contundente para proceder de otra manera, en par¬ 
ticular cuando los dos tamaños de muestra son diferentes. 


Probabilidades de error de tipo II 

La determinación de probabilidades de error de tipo II (o de forma equivalente, potencia = 
1 — /3) con la prueba t con dos muestras es complicada. Parece que no existe una forma sim¬ 
ple de utilizar las curvas [3 de la tabla A. 17. La versión más reciente de MINITAB (Versión 
14) calculará la potencia para la prueba t agrupada pero no para la prueba t con dos mues¬ 
tras. Sin embargo, la página de inicio del Departamento de Estadística de la UCLA 
(http://www.stat.ucla.edu) permite el acceso a una calculadora de potencia que llevará a 
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cabo esto. Por ejemplo, se especificó m = 10, n = 8, <r l = 300 y cr 2 = 225 (estos son los 
tamaños de muestra del ejemplo 9.7, cuyas desviaciones estándar muéstrales son algo más 
pequeñas que estos valores de cr, y cr 2 ) y demandan la potencia de una prueba con nivel de 
0.05 de dos colas de H 0 : /q — ¡x 2 = 0 cuando /x, — /jl 2 — 100, 250 y 500. Los valores de la 
potencia obtenidos son 0.1089, 0.4609 y 0.9635 (correspondientes a ¡3 = 0.89, 0.54 y 0.04), 
respectivamente. En general, (3 disminuirá a medida que se incrementan los tamaños de 
muestra, a medida que se incrementa aya medida que /q — ¿q se aleja de 0. El programa 
también calculará los tamaños de muestra necesarios a fin de obtener un valor específico de 
potencia para un valor particular de /q — /q. 


EJERCICIOS Sección 9.2 (17-35) 


17. Determine el número de grados de libertad para la prueba t 
con dos muestras o el intervalo de confianza en cada una de 
las siguientes situaciones: 

a. m = 10, n = 10, s l = 5.0, s 2 — 6.0 

b. m = 10, n = 15, q = 5.0, s 2 = 6.0 

c. m = 10, n = 15, q = 2.0, s 2 = 6.0 

d. m = 12, n = 24, q = 5.0, s 2 = 6.0 

18. Sean /q y ¿i-, las densidades promedio verdaderas de dos ti¬ 
pos diferentes de ladrillos. Suponiendo normalidad de las 
dos distribuciones de densidad, pruebe H 0 : ¿q — ¡jl 2 = 0 
contra í/ a : /q — /r, A 0 con los siguientes datos: m = 6, 
x = 22.73, q = 0.164, n = 5, y = 21.95 ys 2 = 0.240. 

19. Suponga que /q y /q son distancias de detención medias 
verdaderas a 50 mph de carros de cierto tipo equipados con 
dos tipos diferentes de sistemas de frenos. Use la prueba t 
con dos muestras a un nivel de significación de 0.01 para 
probar H 0 : ¿q — /q = — 10 contra // a : /q — /q < — 10 con 
los siguientes datos: m = 6, x= 115.7, q = 5.03, n = 6, 
y = 129.3 y s 2 = 5.38. 

20. Use los datos del ejercicio 19 para calcular un intervalo de 
confianza de 95% para la diferencia entre la distancia 
de detención promedio verdadera de carros equipados con el 
sistema 1 y carros equipados con el sistema 2. ¿Sugiere 
el intervalo que está disponible información precisa sobre el 
valor de esta diferencia? 

21. Se requieren técnicas no invasivas cuantitativas para la valora¬ 
ción rutinaria de neuropatías periféricas, tales como el síndro¬ 
me de túnel carpiano (CTS, por sus siglas en inglés). El 
artículo “A Gap Detection Tactility Test for Sensory Déficits 
Associated with Carpal Tunnel Syndrome’ - ( Emonomics , 

1995: 2588-2601) reportó sobre una prueba que implicaba de¬ 
tectar una pequeña grieta en una superficie en otras circunstan¬ 
cias lisa tentando con un dedo; esto funcionalmente se asemeja 
a muchas actividades táctiles relacionadas con el trabajo, tal 
como detectar rasguños o defectos superficiales. Cuando no se 
permitía tentar con los dedos, el umbral de detección de grie¬ 
tas promedio muestral con m = 8 sujetos normales fue de 1.71 
trun, y la desviación estándar de la muestra fue 0.53 y con 
n = 10 sujetos con el síndrome de túnel carpiano, la media y 
desviación estándar muéstrales fueron 2.53 y 0.87, respectiva¬ 
mente. ¿Sugieren estos datos que el umbral de detección de 
grietas promedio verdadero de sujetos con CTS excede el 
de sujetos normales? Formule y pruebe las hipótesis pertinen- 24. 
tes utilizando un nivel de significación de 0.01. 


22. La prueba de esfuerzo cortante sesgado es ampliamente 
aceptada para evaluar la adhesión de materiales de repara¬ 
ción resinosos para concreto; utiliza especímenes cilindri¬ 
cos de dos mitades idénticas adheridas a 30°. El artículo 
“Testing the Bond Between Repair Materials and Concre¬ 
te Substrate” (ACI Materials J., 1996: 553-558) reportó 
que para 12 especímenes preparados utilizando un cepillo 
de alambre, la resistencia al esfuerzo cortante media 
(N/mm 2 ) y la desviación estándar fueron de 19.20 y 1.58, 
respectivamente, mientras que para 12 especímenes cince¬ 
lados a mano fueron de 23.13 y 4.01. ¿Parece ser diferen¬ 
te la resistencia promedio verdadera con los dos métodos 
diferentes de preparación de la superficie? Formule y 
pruebe las hipótesis pertinentes con un nivel de significación 
de 0.05. ¿Qué está suponiendo sobre las distribuciones del 
esfuerzo cortante? 

23. Se están utilizando forros internos fusibles con creciente 
frecuencia para soportar la tela externa y mejorar la forma 
y caída de varias piezas de ropa. El artículo “Compatibi- 
lity of Outer and Fusible Interlining Fabrics in Tailored 
Garments” (Textile Res. J., 1997: 137-142) dio los datos 
adjuntos sobre extensibilidad (%) a 100 g/cm tanto de es¬ 
pecímenes de telas de alta calidad (A) como especímenes 
de telas de baja calidad (B). 

A 1.2 0.9 0.7 1.0 1.7 1.7 1.1 0.9 1.7 

1.9 1.3 2.1 1.6 1.8 1.4 1.3 1.9 1.6 

0.8 2.0 1.7 1.6 2.3 2.0 

B 1.6 1.5 1.1 2.1 1.5 1.3 1.0 2.6 

a. Construya curvas de probabilidad normal para verificar 
la factibilidad con ambas muestras seleccionadas de dis¬ 
tribuciones de población normales. 

b. Construya una gráfica comparativa. ¿Sugiere ésta que 
existe una diferencia entre la extensibilidad promedio 
verdadera de especímenes de tela de alta calidad y la de 
especímenes de baja calidad? 

c. La media y desviación estándar muéstrales de la mues¬ 
tra de alta calidad son 1.508 y 0.444, respectivamente 
y las de la muestra de baja calidad son 1.588 y 0.530. 
Use la prueba t con dos muestras para decidir si la ex¬ 
tensibilidad promedio verdadera difiere para los dos 
tipos de tela. 

Los daños en uvas a causa de la depredación de pájaros es 
un problema serio para los viticultores. El artículo 
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“Experimental Method to Investígate and Monitor Bird Be- 
havior and Damage to Vineyards” ( Amer. J. ofEnology and 
Viticulture, 2004: 288-291) reportó sobre un experimento 
que implica una mesa alimentadora de pájaros, un video del 
tiempo transcurrido y alimentos artificiales. Se recopiló in¬ 
formación para dos especies de pájaros diferentes tanto en 
el sitio experimental como en un entorno de viñedo natural. 
Considere los siguientes datos de tiempo (s) empleado en 
una sola visita al lugar. 


Especie 

Ubicación 

n 

X 

EE de la media 

Mirlos 

Experim. 

65 

13.4 

2.05 

Mirlos 

Natural 

50 

9.7 

1.76 

Silverreyes 

Experim. 

34 

49.4 

4.78 

Silverreyes 

Natural 

46 

38.4 

5.06 


a. Calcule un límite de confianza superior para el tiempo 
promedio verdadero que los mirlos emplean en una sola 
visita en el lugar experimental. 

b. ¿Parece que el tiempo promedio empleado por los mir¬ 
los en el lugar experimental excede el tiempo promedio 
verdadero que los pájaros de este tipo emplean en el lu¬ 
gar natural? Pruebe las hipótesis apropiadas. 

c. Calcule la diferencia entre el tiempo promedio verdade¬ 
ro que los mirlos emplean en el lugar natural y el tiem¬ 
po promedio verdadero que los silverreyes emplean en 
el lugar natural y hágalo de modo que informe sobre 
confiabilidad y precisión. 

[Nota: Todas las medianas muéstrales reportadas en el ar¬ 
tículo parecían significativamente más pequeñas que las 
medias, lo que sugiere una asimetría sustancial de la distri¬ 
bución de la población. Los autores en realidad utilizaron el 
procedimiento de prueba libre de distribución presentado en 
la sección 2 del capítulo 15.] 

25. El dolor de espalda baja (DEB) es un serio problema de sa¬ 
lud en muchos entornos industriales. El artículo “Isodyna- 
mic Evaluation of Trunk Muscles and Low-Back Pain 
Among Workers in a Steel Factory” ( Ergnomics , 1995: 
2107-2117) reportó los datos adjuntos sobre rango lateral 
de movimiento (grados) para una muestra de trabajadores 
sin antecedentes de dolor de espalda baja y otra muestra con 
antecedentes de esta dolencia. 

Tamaño de Media DE 

Condición muestra muestral muestral 

Sin DEB (dolor espalda baja) 28 91.5 5.5 

Con DEB 31 88.3 7.8 


Calcule un intervalo de confianza de 90% para la diferencia 
entre el grado de movimiento lateral medio de la población pa¬ 
ra las dos condiciones. ¿El intervalo sugiere que el movimien¬ 
to lateral medio difiere en las dos condiciones? ¿Es diferente el 
mensaje si se utiliza un intervalo de confianza de 95%? 

26. El artículo “The Influence of Corrosión Inhibitor and Sur- 
face Abrasión on the Failure of Aluminum-Wired Twist-on 
Connections” (IEEE Trans. on Components Hybrids , and 
Manuf. Tech., 1984: 20-25) reportó datos sobre mediciones 
de caída potencial para una muestra de conectores alambra¬ 


dos con aluminio de aleación y otra muestra con aluminio 
EC. ¿Sugieren los datos adjuntos obtenidos con SAS que la 
caída de potencial promedio verdadera de conexiones de 
aleación (tipo I) es más alta que las conexiones EC (como 
se manifestó en el artículo)? Realice la prueba apropiada 
con un nivel de significación de 0.01. Al llegar a su conclu¬ 
sión, ¿qué tipo de error podría haber cometido? [Nota: SAS 
reporta el valor P para una prueba de dos colas.] 


Tipo 

N 

Media 

Dev est. 

Error est 

1 

20 

17.49900000 

0.55012821 

0.12301241 

2 

20 

16.90000000 

0.48998389 

0.10956373 


Varianzas T DF Prob > | T | 

Desigual 3.6362 37.5 0.0008 

Igual 3.6362 38.0 0.0008 


27. Se piensa que el codo de tenista es molestado por el impac¬ 
to experimentado cuando se golpea la pelota. El artículo 
“Forces on the Hand in the Tennis One-Handed Backhand” 
(Intl. J. of Sport Biomechanics, 1991: 282-292) reportó la 
fuerza (N) en la mano exactamente después del impacto en 
un golpe de revés con una mano de seis jugadores avanza¬ 
dos y de ocho intermedios. 

Tipo de Tamaño de Media DE 

jugador muestra muestral muestral 

1. Avanzado 6 40.3 11.3 

2. Intermedio 8 21.4 8.3 


En su análisis de los datos, los autores supusieron que am¬ 
bas distribuciones de fuerza eran normales. Calcule un in¬ 
tervalo de confianza de 95% para la diferencia entre fuerza 
promedio verdadera de jugadores avanzados (p : ) y fuer¬ 
za promedio verdadera de jugadores intermedios (p 2 ). 
¿Proporciona su intervalo evidencia contundente para 
concluir que las dos p son diferentes? ¿Habría alcanzado 
la misma conclusión calculando un intervalo de confianza 
para p 2 ~ Pi ( es decir, invirtiendo los subíndices 1 y 2 en 
los dos tipos de jugadores)? Explique. 

28. A medida que la población envejece existe una creciente 
preocupación sobre lesiones relacionadas con accidentes 
que sufren las personas de edad. El artículo “Age and Gen- 
der Differences in Single-Step Recovery from a Forward 
Fall” ( J. of Gerontology, 1999: M44-M50) reportó sobre un 
experimento en el cual el ángulo de inclinación máximo, lo 
más lejos que un sujeto es capaz de inclinarse y aún endere¬ 
zarse en un solo paso, se determinó tanto para una muestra 
de mujeres jóvenes (21-29 años) y una muestra de mujeres 
mayores (67-81 años). Las siguientes observaciones son 
consistentes con los datos que aparecen en el artículo: 

MI: 29, 34, 33, 27, 28, 32, 31, 34, 32, 27 
MM: 18, 15, 23, 13, 12 

¿Sugieren los datos que el ángulo de inclinación máximo pro¬ 
medio de mujeres mayores es más de 10 grados menor que el 
de mujeres jóvenes? Formule y pruebe las hipótesis pertinen¬ 
tes a nivel de significación de 0.10 obteniendo un valor P. 
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29. El artículo “Effect of Internal Gas Pressure on the Com- 
pression Strength of Beverage Cans and Plástic Bottles” (J. 
Testing and Evaluation, 1993: 129-131) incluye los datos 
adjuntos sobre resistencia a la compresión (Ib) para una 
muestra de latas de aluminio de 12 oz de refresco de fresas 
llenas y otra muestra de latas de refresco de cola llenas. 
¿Sugieren los datos que la carbonatación extra de la cola da 
por resultado una resistencia a la compresión más alta? Base 
su respuesta en un valor P. ¿Qué suposiciones son necesa¬ 
rias para su análisis? 

Tamaño de Media DE 

Bebida muestra muestral muestral 


Fresa 15 540 21 

Cola 15 554 15 


30. El artículo “Flexure of Concrete Beams Reinforced with 
Advanced Composite Orthogrids” ( J. of Aerospace Engr., 
1997: 7-15) dio los datos adjuntos sobre carga última (kN) 
de dos tipos diferentes de vigas. 

Tamaño de Media DE 
Tipo muestra muestral muestral 

Malla de fibra de vidrio 26 33.4 2.2 

Malla de carbono 26 42.8 4.3 

comercial 


a. Suponiendo que las distribuciones subyacentes son nor¬ 
males, calcule e interprete un intervalo de confianza 
de 99% para la diferencia entre carga promedio verdade¬ 
ra para las vigas de fibra de vidrio y la de vigas con fi¬ 
bra de carbono. 

b. ¿Da el límite superior del intervalo que calculó en el in¬ 
ciso a) un límite de confianza de 99% para la diferencia 
entre las dos pP. Si no, calcule tal límite. ¿Sugiere fuer¬ 
temente que la carga promedio verdadera de la vigas de 
fibra de carbono es más grande que la de las vigas de fi¬ 
bra de vidrio? Explique. 

31. Remítase al ejercicio 33 en la sección 7.3. El artículo cita¬ 
do también dio las siguientes observaciones sobre el grado 
de polimerización de especímenes con concentración de 
tiempos de viscosidad en un rango más alto: 

429 430 430 431 436 437 

440 441 445 446 447 

a. Trace una gráfica de caja comparativa para las dos 
muestras y comente sobre cualquier característica inte¬ 
resante. 

b. Calcule un intervalo de confianza de 95% para la dife¬ 
rencia entre el grado promedio verdadero de polimeriza¬ 
ción del rango medio y del rango alto. ¿Sugiere el 
intervalo que /u¡ y p, 2 pueden en realidad ser diferentes? 
Explique su razonamiento. 

32. El artículo citado en el ejercicio 34 en la sección 7.3 dio los 
siguientes datos sobre límites de esfuerzo proporcional de es¬ 
pecímenes construidos con dos tipos diferentes de madera: 


9.2 Prueba icón dos muestras e intervalo de confianza 343 

Tipo de Tamaño de Media DE 

madera muestra muestral muestral 

Encino rojo 14 8.48 0.79 

Abeto Douglas 10 6.65 1.28 


Suponiendo que ambas muestras se seleccionaron de distri¬ 
buciones normales, realice una prueba de hipótesis para 
decidir si el límite de esfuerzo proporcional promedio ver¬ 
dadero de juntas de encino rojo excede el de juntas de abe¬ 
to Douglas por más de 1 MPa. 

33. El artículo “The Effects of Low-Fat, Plan-Based Dietary In- 
tervention on Body Weight, Metabolism, and Insulin Sensiti- 
vity in Postmenopausal Women” ( Amer. J. of Med., 2005: 
991-997) reportó sobre los resultados de un experimento en 
el cual la mitad de un grupo de 64 mujeres posmenopáusicas 
con sobrepeso fueron asignadas al azar a una dieta vegetaria¬ 
na particular y la otra mitad recibió una dieta basada en las 
recomendaciones del National Cholesterol Education Pro- 
gram. La pérdida de peso media muestral de aquellas que lle¬ 
varon la dieta vegetariana fue de 5.8 kg y la desviación 
estándar muestral fue de 3.2, en tanto que para aquellas que 
llevaron la dieta de control, la pérdida de peso media y la des¬ 
viación estándar fueron de 3.8 y 2.8, respectivamente. ¿Pare¬ 
ce que la pérdida de peso promedio verdadera con la dieta 
vegetariana excede la de la dieta de control por más de 1 kg? 
Realice una prueba de hipótesis apropiada a un nivel de sig¬ 
nificación de 0.05 basado en el cálculo de un valor P. 

34. Considere la variable t agrupada 

T= (X-Y)- 0% ~ |u 2 ) 

/I I 

S p J~ + ~ 

la cual tiene una distribución t con m + n — 2 grados de li¬ 
bertad cuando ambas distribuciones de población son nor¬ 
males con cr¡ = cr 2 (véase la subsección Procedimientos t 
agrupados para una descripción de S p ). 

a. Use esta variable t para obtener una fórmula de interva¬ 
lo de confianza t agrupado para /u 1 — p 2 . 

b. Se seleccionó una muestra de humificadores ultrasóni¬ 
cos de una marca particular para la cual las observacio¬ 
nes de producción máxima de humedad (oz) en una 
cámara controlada fueron 14.0, 14.3, 12.2 y 15.1. Una 
muestra de una segunda marca arrojó los valores de pro¬ 
ducción 12.1, 13.6, 11.9 y 11.2 (“Múltiple Comparisons 
of Means Using Simultaneous Confidence Intervals”, 
J. ofQuality Technology, 1989: 232-241). Use la fórmu¬ 
la de t agrupada del inciso a) para calcular la diferencia 
entre producciones promedio verdaderas de las dos mar¬ 
cas con un intervalo de confianza de 95 por ciento. 

c. Calcule la diferencia entre las dos ¿i utilizando el inter¬ 
valo t para dos muestras discutido en esta sección y 
compárelo con el intervalo del inciso b). 

35. Remítase al ejercicio 34. Describa la prueba t agrupada pa¬ 
ra probar H 0 : p 1 — p 2 — A 0 cuando ambas distribuciones de 
población son normales con oy = cr 2 . Luego utilice este 
procedimiento de prueba para probar las hipótesis sugeridas 
en el ejercicio 33. 
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9.3 Análisis de datos apareados 

En las secciones 9.1 y 9.2, se consideró probar en busca de una diferencia entre dos medias 
/i[ y ¡Lt Se hizo utilizando los resultados de una muestra aleatoria X { , X 2 , . . . , X m de la dis¬ 
tribución con media /jl 1 y una muestra completamente independiente (de las X) Y t , . . . , Y n 
de la distribución con media ¡j, 2 . Es decir, o se seleccionaron m individuos de la población 
1 y n individuos diferentes de la población 2 o m individuos (u objetos experimentales) re¬ 
cibieron un tratamiento y otro conjunto de n individuos recibieron el otro tratamiento. En 
contraste, existen varias situaciones experimentales en las cuales hay sólo un conjunto de n 
individuos u objetos experimentales y se realizan dos observaciones de cada individuo u ob¬ 
jeto y el resultado es apareado natural de valores. 

Ejemplo 9.8 Las trazas de metales presentes en el agua potable afectan el sabor y las concentraciones 
inusualmente altas plantean un riesgo para la salud. El artículo “Trace Metals of South In- 
dian River” ( Envir. Studies, 1982: 62-66) reporta sobre un estudio en el cual se selecciona¬ 
ron seis lugares en el río (seis objetos experimentales) y se determinó la concentración de 
zinc (mg/1) tanto en el agua superficial como en la del fondo en cada lugar. Los seis pares 
de observaciones aparecen en la tabla adjunta. ¿Sugieren los datos que la concentración pro¬ 
medio verdadera en el agua del fondo excede la del agua de la superficie? 



Ubicación 


1 

2 

3 4 

5 

6 

Concentración de zinc en 
el agua del fondo ( x ) 

0.430 

0.266 

0.567 0.531 

0.707 

0.716 

Concentración de zinc en 
el agua de la superficie (y) 

0.415 

0.238 

0.390 0.410 

0.605 

0.609 

Diferencia 

0.015 

0.028 

0.177 0.121 

0.102 

0.107 


La figura 9.4 a) muestra una curva de estos datos. A primera vista, parece haber poca dife¬ 
rencia entre las muestras x y y. De lugar en lugar, existe mucha variación en cada muestra y 
parece como si cualquier diferencia entre las muestras puede ser atribuida a esta variabili¬ 
dad. No obstante, cuando las observaciones están identificadas por lugar, como en la figura 
9.4 b), emerge una vista diferente. En cada lugar, la concentración en el fondo excede la 
concentración en la superficie. Esto se confirma por el hecho de que todas las diferencias 
x — y que aparecen en la fila inferior de la tabla son positivas. Un análisis correcto de estos 
datos se enfoca en estas diferencias. 


X 

y 


Ubicación x 
Ubicación y 


i •• 


• 

• •• 


• • 



0.2 0.3 

0.4 

0.5 

0.6 

0.7 

0.8 



a) 




2 

1 

4 3 


56 


1 • 1 

1 • 

1 • • 

1 

1 •• 

1 

• 

• •• 


• • 



2 

341 


56 




b) 


Figura 9.4 Gráfica de los datos pareados del ejemplo 9.8. a) observaciones no identificadas por 
ubicación; b) observaciones identificadas por ubicación. 
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O 


Ejemplo 9.9 
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Los datos se componen de n pares independientemente seleccionados (Z 1; L,), 
(X 2 , Y 2 ), (X n Y n ), con E(X¡) = ¡i, y E{Y¡) = p 2 . Sean D, = X x - L„ D 2 = X 2 - Y 2 , 
. . ., D n = X n — Y n , de modo que las D i son las diferencias dentro de los pares. En ese 
caso se supone que las D¡ casi siempre están distribuidas con valor medio ¡i D y 
varianza (normalmente esto es una consecuencia de que las X¡ y Y¡ mismas están 
normalmente distribuidas). 


De nuevo interesa probar las hipótesis con respecto a la diferencia ¡jl í — ¡i-,. El deno¬ 
minador de la prueba_f con dos muestras se obtuvo suponiendo muestras independientes y 
aplicando la regla V(X — Y) = V(X) + V( Y). Sin embargo, con datos apareados, las obser¬ 
vaciones X y Y dentro de cada par a menudo no son independientes, de modo que X y Y no 
son independientes entre sí. Por consiguiente, se debe abandonar la prueba 1 con dos mues¬ 
tras y buscar un método de análisis alternativo. 

Prueba t con datos apareados 

Como los pares diferentes son independientes, las D¡ son independientes entre sí. Sea I) = 
X — Y, donde X y Y son la primera y segunda observaciones, respectivamente, dentro de un 
par arbitrario. Entonces la diferencia esperada es 

Ed = E{X — Y) = E(X) - E( Y) = ,i 2 - ¡i 2 

(la regla de valores esperados utilizada aquí es válida aun cuando X y Y sean dependientes). 
Por consiguiente, cualquier hipótesis con respecto a ¡jl x — ¡i 2 puede ser parafraseada como una 
hipótesis con respecto a la diferencia media ¡jl d . Pero como las D¡ constituyen una muestra 
aleatoria normal (de diferencias) con media ¡l d , las hipótesis con respecto a ¡jl d se prueban por 
medio de una prueba t con una muestra. Es decir, para probar hipótesis con respecto a p¡ — 
¡i 2 cuando los datos están apareados, se forman las diferencias D v D 2 , . . . , D n y se realiza 
una prueba t con una muestra (basada en n — 1 grados de libertad ) de las diferencias. 



Prueba f con datos apareados 


Hipótesis nula: H 0 : p D = A 0 


Valor estadístico de prueba: t = 


(donde D = X — Y es la diferencia entre la primera 
y segunda observaciones dentro de un par y p D = 
Ei ~ Ei) 


ífl/Vñ 


(donde d y s D son la media y desviación 
estándar muéstrales, respectivamente, de 
las d¡) 


Hipótesis alternativa Región de rechazo para una prueba a nivel a 

Ed> ^0 t^ta.n-1 

H z- Ed<\ 1 

Ed ^ ^ 0 O t — Íq/2,/1-1 O t — ~t a/2n - 1 

Se puede calcular un valor P como se hizo en pruebas t anteriores. 


Los desórdenes musculoesqueléticos del cuello y hombro son comunes entre empleados de 
oficina que realizan tareas repetitivas mediante pantallas de visualización. El artículo “Up- 
per-Arm Elevation During Office Work” ( Ergonomics , 1996: 1221-1230) reportó sobre un es¬ 
tudio para determinar si condiciones de trabajo más variadas habrían tenido algún impacto 
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en el movimiento del brazo. Los datos adjuntos se obtuvieron con una muestra de n = 16 
sujetos. Cada observación es la cantidad de tiempo, expresada como una proporción de 
tiempo total observado, durante el cual la elevación del brazo fue de menos de 30°. Las dos 
mediciones de cada sujeto se obtuvieron con una separación de 18 meses. Durante este perio¬ 
do, las condiciones de trabajo cambiaron y se permitió que los sujetos realizaran una variedad 
más amplia de tareas. ¿Sugieren estos datos que el tiempo promedio verdadero durante el cual 
la elevación es de menos de 30° luego del cambio difiere de lo que era antes del mismo? 


Sujeto 

1 

2 

3 

4 

5 

6 

7 

8 

Antes 

81 

87 

86 

82 

90 

86 

96 

73 

Después 

78 

91 

78 

78 

84 

67 

92 

70 

Diferencia 

3 

-4 

8 

4 

6 

19 

4 

3 

Sujeto 

9 

10 

11 

12 

13 

14 

15 

16 

Antes 

74 

75 

72 

80 

66 

72 

56 

82 

Después 

58 

62 

70 

58 

66 

60 

65 

73 

Diferencia 

16 

13 

2 

22 

0 

12 

-9 

9 


La figura 9.5 muestra una curva de probabilidad normal de las 16 diferencias; el patrón se¬ 
guido por la curva es bastante recto, lo que afirma la suposición de normalidad. En la figu¬ 
ra 9.6 aparece una gráfica de caja de estas diferencias; la gráfica de caja se encuentra 
considerablemente a la derecha de cero, lo que sugiere que quizá pt D > 0 (observe también 
que 13 de las 16 diferencias son positivas y sólo dos son negativas). 



Curva de probabilidad normal 



Promedio 6.75 Prueba W de normalidad 

Desv. Estd 8.23408 R: 0.9916 

Núm. de datos 16 valor p (aprox.): > 0.1000 


Figura 9.5 Curva de probabilidad normal generada por MINITAB de las diferencias en el ejemplo 9.9. 



-10 0 10 


20 


Diferencia 


Figura 9.6 Gráfica de caja de la diferencia en el ejemplo 9.9. 
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9.3 Análisis de datos apareados 347 
Utilice ahora la secuencia de pasos recomendada para probar las hipótesis apropiadas. 

1. Sea ¡j, d la diferencia promedio verdadera entre el tiempo de elevación antes del cambio 
de las condiciones de trabajo y el tiempo después del cambio. 

2. H 0 : /jl d = 0 (no existe diferencia entre el tiempo promedio verdadero antes del cambio y el 

tiempo promedio verdadero después del cambio) 

3. H á : n D A 0 

d — 0 d 
* s D /\ r ñ s D /\^ñ 

5. n = 16, = 108, Idj = 1746, de donde d = 6.75, s D = 8.234, y 

6.75 

r = 8.234/VÍ6 = 3-28 ” 3,3 

6 . La tabla A.8 del apéndice muestra que el área a la derecha de 3.3 bajo la curva t con 
15 grados de libertad es 0.002. La desigualdad de H d implica que la prueba de dos 
colas es apropiada, de modo que el valor P es aproximadamente 2(0.002) = 0.004 
(MINITAB da 0.0051). 

7. Como 0.004 < 0.01, la hipótesis nula puede ser rechazada a un nivel de significación de 

0.05 o 0.01. Parece que la diferencia promedio verdadera entre los tiempos es algún 
valor distinto de cero; es decir, el tiempo promedio verdadero después del cambio es 
diferente del de antes del cambio. ■ 

Cuando el número de pares es grande, la suposición de distribución de diferencia nor¬ 
mal no es necesaria. El límite del teorema central valida la prueba z resultante. 

Un intervalo de confianza para /jl d 

En la misma forma en que el intervalo t para una media de población única está basada en 
la variable t, T = (X — ix)/(S/\^ñ), un intervalo de confianza t para /%(= /a, — /x 0 ) está ba¬ 
sado en el hecho de que 

_ D ~ Pd 

T ~ S D /Vñ 

tiene una distribución t con n — 1 grados de libertad. La manipulación de la variable f, co¬ 
mo en derivaciones previas de intervalos de confianza, produce el siguiente intervalo de 
confianza de 100(1 — a )%: 



El intervalo de confianza t apareado para p,„ es 

d — L/2,71-1 ’ s D f\/ñ 

Al retener el signo pertinente y al reemplazar t a/2 con t a se obtiene un límite de con¬ 
fianza unilateral. 


Cuando n es pequeño, la validez de este intervalo requiere que la distribución de diferencias 
sea por lo menos aproximadamente normal. Con n grande, el límite del teorema central 
garantiza que el intervalo z resultante es válido sin ninguna restricción en la distribución de 
diferencias. 
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Ejemplo 9.10 La adición de imágenes médicas computarizadas a una base de datos promete proporcionar 
grandes recursos para médicos. Sin embargo, existen otros métodos de obtener tal informa¬ 
ción, de modo que el tema de eficiencia de acceso tiene que ser investigado. El artículo “The 
Comparative Effectiveness of Conventional and Digital Image Librarles” ( J. of Audiovisual 
Media in Medicine, 2001: 8-15) reportó sobre un experimento en el cual a 11 profesionis¬ 
tas médicos expertos en la computadora se les tomó el tiempo tanto mientras recuperaban 
una imagen de una biblioteca de diapositivas y mientras recuperaban la misma imagen 
de una base de datos de una computadora con conexión a la Web. 


Sujeto: 1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

Diapositiva: 30 

35 

40 

25 

20 

30 

35 

62 

40 

51 

25 

42 

33 

Digital: 25 

16 

15 

15 

10 

20 

7 

16 

15 

13 

11 

19 

19 

Diferencia: 5 

19 

25 

10 

10 

10 

28 

46 

25 

38 

14 

23 

14 


Sea ¡jb D la diferencia media verdadera entre el tiempo de recuperación de diapositivas (s) 
y el tiempo de recuperación digital. El uso de un intervalo de confianza t apareado para es¬ 
timar /jl d requiere que la distribución de diferencia sea por lo menos aproximadamente nor¬ 
mal. La configuración lineal de los puntos en la curva de probabilidad normal generada por 
MINITAB (figura 9.7) valida la suposición de normalidad. (Aparecen sólo 9 puntos debido 
a empates en las diferencias.) 



Dif 

Promedio: 20.5385 Prueba W de normalidad 

Desv.Estd.: 11.9625 R: 0.9724 

N: 13 Valor P (aprox.): > 0.1000 

Figura 9.7 Curva de probabilidad normal de las diferencias en el ejemplo 9.10. 



Las cantidades pertinentes son X d¡ = 267, Y,dj= 7201, de donde d = 20.5, s D = 11.96. 
El valor t crítico requerido para un intervalo de confianza de 95% es r 0025 12 = 2.179 y el 
intervalo de confianza de 95% es 

s D 11.96 

d ± ta/2,n—i • = 20.5 ± (2.179) • = 20.5 ± 7.2 = (13.3, 27.7) 

Se puede tener una plena confianza (al nivel de confianza de 95%) de que 13.3 < ¡jl d < 27.7. 
Este intervalo es bastante ancho, una consecuencia derivada del hecho de que la desviación 
estándar muestral es relativamente grande en relación con la media muestral. Se requeriría 
un tamaño de muestra mucho más grande que 13 para calcular con mayor precisión. Obser¬ 
ve, sin embargo, que 0 queda muy afuera del intervalo, lo que sugiere que ¡i n > 0; esto se 
confirma con una prueba formal de hipótesis. ■ 
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Datos apareados y procedimientos t con dos muestras 

Considérese el uso de la prueba t de datos apareados con dos muestras. Los numeradores de 
los dos estadísticos de prueba son idénticos, puesto que d = Y.d/n = |X(x¡ — y¡)]/n = 
(2.x¡)/n — £>',■)/« = x — y. La diferencia entre los estadísticos se debe por completo a los 
denominadores. Cada estadístico de prueba se obtiene estandarizando X — Y (= D). Pero 
en la presencia de dependencia la estandarización t con dos muestras es incorrecta. Para ver 
esto, recuérdese de la sección 5.5 que 

V(X ± Y) = V(X) + V(Y) ± 2 Cov(X, Y) 


La correlación entre Xy Fes 

p = CorríX, Y) = Cov(X, F)/[VWX) • VWF)] 


Se desprende que 


V(X - Y) = a\ + a\ 
Aplicando ésta a X — Y se obtiene 


2 ptr j (T 2 


- - - /l- \ V(D) 

V(X — Y) = V(D) = L-X/.L = - L - 

\n ) n 


<T\ + cr\ — 2p<J l CT 2 
n 


La prueba t con dos muestras está basada en la suposición de independencia, en cuyo 
caso p = 0. Pero en muchos experimentos apareados, habrá una fuerte dependencia positi¬ 
va entre X y Y (X grande asociada con Y grande), de modo que p será positiva y la varianza 
del - F será más pequeña que cr\ln + cr\ln. Por lo tanto siempre que haya dependencia 
positiva dentro de los pares, el denominador del estadístico t apareado deberá ser más pe¬ 
queño para t de la prueba con muestras independientes. Con frecuencia la t con dos mues¬ 
tras se aproximará mucho más a cero que la t apareada, subestimando considerablemente la 
significación de los datos. 

Asimismo, cuando los datos están apareados, el intervalo de confianza 1 apareado normal¬ 
mente será más angosto que el intervalo de confianza t para dos muestras (incorrecto). Esto es 
porque en general existe mucho menos variabilidad en las diferencias que en los valores xy y. 

Experimentos apareados contra no apareados 

En los ejemplos, se obtuvieron datos apareados con dos observaciones del mismo sujeto 
(ejemplo 9.9) u objeto experimental (localización en el ejemplo 9.8). Aun cuando esto no 
puede hacerse, se pueden obtener datos apareados con dependencia dentro de pares empa¬ 
rejando individuos u objetos en relación con una o más características que se piensa influ¬ 
yen en las respuestas. Por ejemplo, en un experimento médico para comparar la eficacia de 
dos medicamentos para bajar la presión sanguínea, el presupuesto del experimentador per¬ 
mitiría el tratamiento de 20 pacientes. Si se seleccionan 10 al azar para tratamiento con el 
primer medicamento y se seleccionan otros 10 independientemente para tratamiento con 
el segundo medicamento, el resultado es un experimento con muestras independientes. 

No obstante, el experimentador, sabiendo que la edad y el peso influyen en la presión 
sanguínea, podría decidir crear pares de pacientes de modo que dentro de cada uno de los 
pares resultantes, la edad y el peso fueran aproximadamente iguales (aunque pudiera haber 
diferencias apreciables entre los pares). Entonces cada medicamento sería administrado a un 
paciente diferente dentro de cada par para un total de 10 observaciones de cada medicamento. 

Sin este emparejamiento (o “bloqueo”), podría parecer que un medicamento sobrepasa el 
desempeño de otro simplemente porque los pacientes en una muestra pesaban menos y eran 
más jóvenes y por tanto más susceptibles a reducir su presión sanguínea que los pacientes más 























c9_p325-368.qxd 3/12/08 4:21 AM Page 350 



350 CAPÍTULO 9 Inferencias basadas en dos muestras 

pesados y de más edad presentes en la segunda muestra. Sin embargo, hay un precio que pagar 
por el emparejamiento, un número de grados de libertad más pequeño para el análisis aparea¬ 
do, así que hay que preguntarse cuándo se debe preferir un experimento sobre el otro. 

No existe una respuesta directa y precisa a esta pregunta, pero sí algunas recomenda¬ 
ciones útiles. Si se tiene una opción entre dos pruebas t que son válidas (y realizadas al mis¬ 
mo nivel de significación a), se deberá preferir la prueba que tenga el número más grande 
de grados de libertad. La razón de esto es que un número más grande de grados de libertad 
significa una /3 más pequeña con cualquier valor alternativo fijo del parámetro o parámetros. 
Esto es, con un error de probabilidad de error de tipo I, la probabilidad de un error de tipo 
II se reduce al incrementarse los grados de libertad. 

Sin embargo, si las unidades experimentales son bastante heterogéneas en su respues¬ 
ta, será difícil detectar diferencias pequeñas pero significativas entre dos tratamientos. Esto 
en esencia es lo que aconteció en el conjunto de datos en el ejemplo 9.8; con ambos “trata¬ 
mientos” (agua del fondo y agua superficial), existe una gran variabilidad entre lugares, lo 
que tiende a enmascarar diferencias en tratamientos dentro de los lugares. Si existe una alta 
correlación positiva dentro de unidades experimentales o sujetos, la varianza de D = X — Y 
será mucho más pequeña que la varianza no apareada. Debido a que esto reduce la varian¬ 
za, será más fácil detectar una diferencia con muestras apareadas que con muestras indepen¬ 
dientes. Los pros y los contras de aparear ahora se resumen como sigue. 


1. Si existe una gran heterogeneidad entre unidades experimentales y una gran corre¬ 
lación dentro de unidades experimentales (p grande positiva), entonces la pérdida 
de grados de libertad será compensada por la precisión incrementada asociada con 
el apareamiento, así que se prefiere un experimento apareado a un experimento 
con muestras independientes. 

2. Si las unidades experimentales son relativamente homogéneas y la correlación 
dentro de los pares no es grande, la ganancia en precisión a causa del apareamien¬ 
to será superada por la disminución de grados de libertad, así que se deberá utili¬ 
zar un experimento con muestras independientes. 


Desde luego, normalmente los valores de crf, a\, y p no serán conocidos con preci¬ 
sión, así que se requerirá que un investigador haga una apreciación educada sobre si se 
obtiene la situación 1 o la 2. En general, si el número de observaciones obtenidas es gran¬ 
de, entonces una pérdida de grados de libertad (p. ej., de 40 a 20) no será seria; pero si el 
número es pequeño, entonces la pérdida (por ejemplo, de 16 a 8) debido al apareamiento 
puede ser seria si no es compensada por la precisión incrementada. Consideraciones simila¬ 
res son válidas cuando se elige entre dos tipos de experimentos para estimar p.¡ — p, 2 con 
un intervalo de confianza. 


- 

EJERCICIOS Sección 9.3 (36-46) 


36. Considere los datos adjuntos sobre carga de ruptura (kg/25 
mm de ancho) de varias telas tanto desgastadas como no des¬ 
gastadas (“The Effect of Wet Abrasive Wear on the Tensile 
Properties of Cotton and Polyester-Cotton Fabrics”, J. Testing 
and Evaluation, 1993: 84-93). Use la prueba t apareada, como 
lo hicieron los autores del citado artículo, para probar H 0 : 
p D = 0 contra // a : p 0 > 0 a un nivel de significación de 0.01. 


Tela 



1 

2 

3 

4 

5 

6 

7 

8 

NG 

36.4 

55.0 

51.5 

38.7 

43.2 

48.8 

25.6 

49.8 

G 

28.5 

20.0 

46.0 

34.5 

36.5 

52.5 

26.5 

46.5 
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37. Se ha identificado cromo hexavalente como carcinógeno in¬ 
halado y como una toxina presente en el aire de interés en 
varios lugares diferentes. El artículo “Airbome Hexavalent 
Chromium in Southwestem Ontario” ( J. of Air and Waste 
Mgmnt. Assoc., 1997: 905-910) reportó los datos adjuntos 
tanto de concentración bajo techo como al aire libre (nano- 
gramos/m 3 ) para una muestra de casas seleccionadas al azar 
en cierta región. 


Casa 



1 

2 3 

4 

5 

6 

7 

8 

9 

Bajo techo 

0.07 0 

.08 0.09 0.12 0.12 

0.12 

0.13 

0.14 

0.15 

Intemperie 

0.29 0 

.68 0.47 0.54 0.97 

0.35 

0.49 

0.84 

0.86 





Casa 





10 

11 

12 

13 

14 

15 

16 

17 

Bajo techo 

0.15 

0.17 

0.17 

0.18 

0.18 

0.18 

0.18 

0.19 

Intemperie 

0.28 

0.32 

0.32 

1.55 

0.66 

0.29 

0.21 

1.02 





Casa 





18 

19 

20 

21 

22 

23 

24 

25 

Bajo techo 

0.20 

0.22 

0.22 

0.23 

0.23 

0.25 

0.26 

0.28 

Intemperie 

1.59 

0.90 

0.52 

0.12 

0.54 

0.88 

0.49 

1.24 





Casa 





26 

27 

28 

29 

30 

31 

32 

33 

Bajo techo 

0.28 

0.29 

0.34 

0.39 

0.40 

0.45 

0.54 

0.62 

Intemperie 

0.48 

0.27 

0.37 

1.26 

0.70 

0.76 

0.99 

0.36 


a. Calcule un intervalo de confianza para la diferencia de 
media de población entre concentraciones bajo techo y a 
la intemperie utilizando un nivel de confianza de 95% e 
interprete el intervalo resultante. 

b. Si la 34 a fuera seleccionada al azar de la población, ¿en¬ 
tre qué valores pronosticaría que quede la diferencia de 
concentraciones? 

38. Se sacaron especímenes de concreto con proporciones va¬ 
riables de altura a diámetro de varias posiciones en el cilin¬ 
dro original tanto de una mezcla de concreto de resistencia 
normal como de una mezcla de alta resistencia. Se deter¬ 
minó el esfuerzo pico (MPa) de cada mezcla y se obtuvie¬ 
ron los siguientes datos (“Effect of Length on Compressive 
Strain Softening of Concrete”, J. of Ener. Mechanics, 
1997: 25-35): 


Condición de prueba 



1 

2 

3 

4 

5 

Normal 

42.8 

55.6 

49.0 

48.7 

44.1 

Alta 

90.9 

93.1 

86.3 

90.3 

88.5 



Condición de prueba 



6 

7 

8 

9 

10 

Normal 

55.4 

50.1 

45.7 

51.4 

43.1 

Alta 

88.1 

93.2 

90.8 

90.1 

92.6 



Condición de prueba 



11 

12 

13 

14 

15 

Normal 

46.8 

46.7 

47.7 

45.8 

45.4 

Alta 

88.2 

88.6 

91.0 

90.0 

90.1 


9.3 Análisis de datos apareados 351 

a. Construya una gráfica de caja comparativa de esfuerzos 
pico para los dos tipos de concreto y comente sobre 
cualquier característica interesante. 

b. Estime la diferencia entre esfuerzos pico promedio ver¬ 
daderos de los dos tipos de concreto en una forma que 
transmita información sobre precisión y confiabilidad. 
Asegúrese de verificar la factibilidad de cualquier supo¬ 
sición requerida en su análisis. ¿Parece factible que los 
esfuerzos pico promedio verdaderos para los dos tipos de 
concreto sean idénticos? ¿Por que sí o por qué no? 

39. Científicos e ingenieros con frecuencia desean comparar 
dos técnicas diferentes de medir o determinar el valor de 
una variable. En tales situaciones, el interés se concentra en 
probar si la diferencia media en las mediciones es cero. El 
artículo “Evaluation of the Deuterium Dilution Technique 
Against the Test Weighing Procedure for the Determination 
of Breast Milk Intake” ( Amer. J. Clinical Nutr., 1983: 996- 
1003) reporta los datos adjuntos sobre la cantidad de leche 
ingerida por cada uno de 14 infantes seleccionados al azar 


Infante 



1 

2 

3 

4 

Método isotópico 

1509 

1418 

1561 

1556 

Método de ponderación 

1498 

1254 

1336 

1565 

Diferencia 

11 

164 

225 

-9 



Infante 



5 

6 

7 

8 

Método isotópico 

2169 

1760 

1098 

1198 

Método de ponderación 

2000 

1318 

1410 

1129 

Diferencia 

169 

442 

-312 

69 


Infante 




9 

10 

11 


Método isotópico 

1479 

1281 

1414 


Método de ponderación 

1342 

1124 

1468 


Diferencia 

137 

157 

-54 



Infante 




12 

13 

14 


Método isotópico 

1954 

2174 

2058 


Método de ponderación 

1604 

1722 

1518 


Diferencia 

350 

452 

540 



a. ¿Es factible que la distribución de la población de las di¬ 
ferencias sea normal? 

b. ¿Parece que la diferencia promedio verdadera entre va¬ 
lores de ingesta medidos con los dos métodos es algún 
valor diferente de cero? Determine el valor P de la 
prueba y utilícelo para llegar a una conclusión a nivel 
de significación de 0.05. 

40. La lactancia estimula una pérdida temporal de masa ósea 
para proporcionar cantidades de calcio adecuadas para la 
producción de leche. El artículo “Bone Mass Is Recovered 
from Lactation to Postweaning in Adolescent Mothers with 
Low Calcium Intakes” ( Amer. J. Clinical Nutr., 2004; 1322- 
1326) dio los siguientes datos sobre contenido total de mi¬ 
nerales en los huesos del cuerpo (TBBMC, por sus siglas en 
inglés) (g) para una muestra tanto durante la lactancia (L) 
como en el periodo de posdestete (P). 
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Sujeto 

123456789 10 

L 1928 2549 2825 1924 1628 2175 2114 2621 1843 2541 

P 2126 2885 2895 1942 1750 2184 2164 2626 2006 2627 

a. ¿Sugieren los datos que el contenido total de minerales en 
los huesos del cuerpo durante el posdestete excede el de la 
etapa de lactancia por más de 25 g? Formule y pruebe las 
hipótesis apropiadas utilizando un nivel de significación de 
0.05 [Nota: La curva de probabilidad normal apropiada 
muestra algo de curvatura pero no suficiente para sembrar 
dudas sustanciales sobre una suposición de normalidad.] 

b. Calcule un límite de confianza superior utilizando un nivel 
de confianza de 95% para la diferencia promedio verdadera 
entre TBBMC durante el posdestete y durante la lactancia. 

c. ¿Conduce el uso (incorrecto) de la prueba t con dos 
muestras para probar las hipótesis sugeridas en a) a la 
misma conclusión a la que se llegó allí? Explique. 

41. En un experimento diseñado para estudiar los efectos de ni¬ 
vel de iluminación en el desempeño de una tarea (“Perfor¬ 
mance of Complex Tasks Under Different Levels of 
Illumination”, J. Illuminating Eng., 1976: 235-242), se re¬ 
quirió que sujetos insertaran una cánula de punta fina en los 
ojillos de diez agujas en rápida sucesión con un bajo nivel 
de iluminación con un fondo negro y un nivel de ilumina¬ 
ción más alto con un fondo blanco. Cada valor de dato es el 
tiempo (s) requerido para completar la tarea. 

Sujeto 

1_2_3_4_5 

Negro 25.85 28.84 32.05 25.74 20.89 

Blanco 18.23 20.84 22.96 19.68 19.50 

Sujeto 

6_7_8_9 

Negro 41.05 25.01 24.96 27.47 

Blanco 24.98 16.61 16.07 24.59 


¿Indican los datos que el nivel de iluminación más alto re¬ 
duce por más de 5 s el tiempo de terminación de la tarea 
promedio verdadero? Pruebe las hipótesis apropiadas utili¬ 
zando el método del valor P. 

42. Se ha estimado que entre 1945 y 1971, nacieron 2 millones de 
niños de madres tratadas con dietilestibrestrol (DES, por sus 
siglas en inglés) un estrógeno no esteroidal recomendado pa¬ 
ra el mantenimiento del embarazo. La FDA (Federal Drug 
Administration) vetó este medicamento en 1971 porque inves¬ 
tigaciones indicaron que había una conexión con la incidencia 
de cáncer cervical. El artículo “Effects of Prenatal Exposure 
to Diethylstilbestrol (DES) on Hemispheric Laterality and 
Spatial Ability in Human Males” (Hormones and Behavior, 
1992: 62-75) discutió un estudio en el cual 10 varones expues¬ 
tos a DES y sus heimanos no expuestos fueron sometidos a 
varias pruebas. Estos son los datos sobre los resultados de una 
prueba de habilidad espacial: x = 12.6 (expuestos), y = 13.7, 
y error estándar de la diferencia media = 0.5. Pruebe a un ni¬ 
vel de 0.05 para ver si la exposición tiene que ver con la habi¬ 
lidad espacial reducida mediante la obtención del valor P. 

43. La enfermedad de Cushing se caracteriza por debilidad 
muscular debido a una disfunción de la suprarrenal y pitui¬ 


taria. Para administrar un tratamiento eficaz, es importante 
detectar la enfermedad de Cauchy en la niñez tan pronto co¬ 
mo sea posible. La edad al inicio de los síntomas y la edad 
en el momento del diagnóstico en 15 niños que padecen 
la enfermedad aparecieron en el artículo “Treatment of Cus¬ 
hing's Disease in Childhood and Adolescence by Transphe- 
noidal Microadenomectomy” (New Engl. J. ofMed., 1984: 
889). A continuación se dan los valores de las diferencias de 
edades al principio de los síntomas y la edad en el momen¬ 
to del diagnóstico: 

-24 -12 -55 -15 -30 -60 -14 -21 

-48 -12 -25 -53 -61 -69 -80 

a. ¿Siembra una fuerte duda la curva de probabilidad nor¬ 
mal adjunta sobre la normalidad aproximada de la distri¬ 
bución de diferencias de la población? 

Diferencia 
-10 — 

. • * 

-20 - 

• • 

-30 - • 

-40 - 
- 50 - 

-60 - * • 

-70 - • 


-1.5 -0.5 0.5 1.5 

b. Calcule un límite de confianza de 95% inferior para la 
diferencia media de la población e interprete el límite 
resultante. 

c. Suponga que ya se habían calculado las diferencias (edad 
al momento del diagnóstico) — (edad al inicio de los sínto¬ 
mas). ¿Cuál sería un límite de confianza superior de 95% 
para la diferencia media de la población correspondiente? 

44. El ejemplo 7.11 aportó datos sobre el módulo de elasticidad 
obtenido un minuto después de cargar con una configura¬ 
ción de especímenes de madera. El artículo citado también 
aportó los valores del módulo de elasticidad obtenidos cua¬ 
tro semanas después de cargar los mismos especímenes de 
madera. A continuación se presentan los datos. 


Observación 1 min 4 semanas Diferencia 


1 

10 490 

9 110 

1380 

2 

16 620 

13 250 

3370 

3 

17 300 

14 720 

2580 

4 

15 480 

12 740 

2740 

5 

12 970 

10 120 

2850 

6 

17 260 

14 570 

2690 

7 

13 400 

11 220 

2180 

8 

13 900 

11 100 

2800 

9 

13 630 

11 420 

2210 

10 

13 260 

10910 

2350 

11 

14 370 

12 110 

2260 

12 

11 700 

8 620 

3080 

13 

15 470 

12 590 

2880 

14 

17 840 

15 090 

2750 

15 

14 070 

10 550 

3520 

16 

14 760 

12 230 

2530 


Calcule e interprete un límite de confianza superior para la 
diferencia promedio verdadera entre el módulo después de 
1 minuto y el módulo después de 4 semanas; primero com¬ 
pruebe la factibilidad de cualquier suposición necesaria. 
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9.4 

45. El artículo “Slender High-Strength RC Columns Under Eccen- 
tric Compressiorí" (Magazine of Concrete Res., 2005: 361- 
370) dio los datos adjuntos sobre resistencia de cilindros 
(MPa) de varios tipos de columnas curadas tanto en condicio¬ 
nes húmedas como en condiciones secas en el laboratorio. 


Tipo 



1 

2 

3 

4 

5 

6 

H: 

82.6 

87.1 

89.5 

88.8 

94.3 

80.0 

LS: 

86.9 

87.3 

92.0 

89.3 

91.4 

85.9 


7 

8 

9 

10 

11 

12 

H: 

86.7 

92.5 

97.8 

90.4 

94.6 

91.6 

LS: 

89.4 

91.8 

94.3 

92.0 

93.1 

91.3 
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a. Estime la diferencia en la resistencia promedio verdade¬ 
ra en las dos condiciones secas en una forma que dé in¬ 
formación sobre confiabilidad y precisión e interprete la 
estimación. ¿Qué sugiere la estimación sobre cómo se 
compara la resistencia promedio verdadera en condicio¬ 
nes húmedas y en condiciones secas en el laboratorio? 

b. Verifique la plausibilidad de cualquier suposición que 
fundamente su análisis de (a). 

46. Construya un conjunto de datos apareados para el cual t = °°, 
de modo que los datos sean altamente significativos cuando 
se utilice el análisis correcto, aunque t para la prueba t con 
dos muestras esté bastante cerca de cero, de tal suerte que el 
análisis incorrecto dé un resultado insignificante. 


9.4 Inferencias sobre una diferencia entre proporciones 
de población 

Después de presentar métodos para comparar las medias de dos poblaciones diferentes, aho¬ 
ra se presta atención a la comparación de dos proporciones de población. Un individuo u ob¬ 
jeto se considera como éxito E si él/ella/ello posee alguna característica de interés (alguien 
que se graduó de una universidad, un refrigerador con hacedor de cubos de hielo, etc.) Sea 

p { = la proporción de éxitos (E) en la población #1 
p 2 = la proporción de éxitos (E) en la población #2 

Alternativamente, p l (p 2 ) pueden ser consideradas como la probabilidad de que un individuo 
u objeto seleccionado al azar de la primera (segunda) población sea un éxito. 

Supóngase que se selecciona un tamaño de muestra m de la primera población e inde¬ 
pendientemente, se selecciona una muestra de tamaño n de la segunda. Sea X el número de 
éxitos ( E ) en la primera muestra y Y el número de éxitos (E) en la segunda. La independen¬ 
cia de las dos muestras implica que X y Y son independientes. Siempre que las dos mues¬ 
tras sean mucho más pequeñas que los tamaños de población correspondientes, se puede 
considerar que las distribuciones de A y Y son binomiales. 

El estimador obvio de p¡ — p-,, la diferencia en las proporciones de la población, es la 
diferencia correspondiente en las proporciones muéstrales Xhn — Yin. Con p { = XIm y 
p 0 = Yin, el estimador de p x — p n se expresa como — p 2 . 


PROPOSICIÓN 

Sean X ~ Bin(m, p { ) y Y ~ Bin(n, p 2 ) con X y Y variables independientes. Entonces 


E(Pí ~P 2 ) =Pi~ Pi 



de modo que p¡ — p 2 sea un estimador insesgado de p { — p 2 y 



~ ~ P\ c l\ P7Q7 

v (Pi Pi) - + (donde q¡ - 1 p¡) 

m n 

(9.3) 


Comprobación Como E{X) 

i L - v -y 

\ m n 


■ mp l y E{Y) = np 2 , 

lili 

E(X) - — E{Y) = mp¡ - np 2 = p, - p 2 
m n m n 


Como V(X) = mp x q v V(Y) = np 2 q 2 y X y Y son independientes. 


i 


m 



\v(X) + \V(Y ) 

m n A 


P\<h P 2 Q 2 


m 


n 
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Primero se abordarán situaciones en las que tanto m como n son grandes. Entonces 
como las distribuciones de /3¡ y p 2 son aproximadamente normales, la distribución del esti¬ 
mador /3¡ — p 2 también es normal en forma aproximada. Al estandarizar /3¡ — p 2 se obtiene 
una variable Z cuya distribución es aproximadamente normal estándar. 

z _ Pi~P2~ (Pi - Pí) 

ÍMl + Eit, 

V m n 


Procedimiento de prueba con muestra grande 

Análogamente a la hipótesis para /i¡ — ¡jl 2 , la hipótesis nula más general que un investiga¬ 
dor podría considerar sería de la forma H 0 : /;, — p 2 = A 0 , donde A 0 es de nuevo un número 
especificado. Aunque para medias de población el caso A 0 A 0 no presentó dificultades, para 
proporciones de población los casos A 0 = 0 y A 0 A 0 deben ser considerados por separado. 
Como la mayoría de los problemas reales de esta clase implican A 0 = 0 (es decir, la hipóte¬ 
sis nula /?[ = p 2 ), se abordará este caso. Cuando H 0 : p l — p 2 = 0 es verdadera, sea p el valor 
común de p, y p 2 (y del mismo modo para q). Entonces la variable estandarizada 



tiene aproximadamente una distribución estándar normal cuando H 0 es verdadera. Sin em¬ 
bargo, esta Z no sirve como estadístico de prueba porque el valor de p es desconocido, H 0 
afirma sólo que existe un valor común de p, pero no dice cuál es ese valor. Al reemplazar p 
y q en (9.4) por estimadores apropiados se obtiene un estadístico de prueba. 

Suponiendo que p l = p 2 = p, en lugar de muestras de tamaño m y n de dos poblacio¬ 
nes diferentes (dos distribuciones binomiales distintas), en realidad se tiene una sola mues¬ 
tra de tamaño m + n de una población con proporción p. El número total de individuos en 
esta muestra combinada que tiene la característica de interés es X + Y. El estimador de p es 
entonces 


„ X + Y m n 

P = —— = ——Pi + — T Pi (9-5) 

m + n m + n m + n 

La segunda expresión para/3 muestra que en realidad es un promedio ponderado de los es¬ 
timadores /3j y p 2 obtenidos con las dos muestras. Si se utiliza p y q = 1 — p en lugar de p y 
q en (9.4) se obtiene un estadístico de prueba cuya distribución es aproximadamente normal 
estándar cuando H 0 es verdadera. 



Hipótesis nula: H 0 : p¡ — p 2 = 0 

Valor estadístico de prueba (muestras grandes): z = 


Pi ~Pi 



Hipótesis alternativa Región de rechazo para una prueba a nivel a aproximado 


Pi ~ Pi > o 
Pi ~ Pi < o 
tfa : Pl ~ P2 * 0 



O Z — Z a ,2 O Z — -Z al2 


Se calcula un valor P del mismo modo que para pruebas z previas. 
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Ejemplo 9.11 


e 
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Algunos acusados en procesos criminales se declaran culpables y son sentenciados sin un 
juicio en tanto que otros que se declaran inocentes de manera subsecuente son encontrados 
culpables y entonces son sentenciados. En años recientes, los eruditos en leyes han especu¬ 
lado en cuanto si las sentencias de aquellos que se declaran culpables difieren en severidad 
de las sentencias de aquellos que se declaran inocentes y subsecuentemente son juzgados 
culpables. Considere los datos adjuntos sobre acusados de robo en el condado de San Fran¬ 
cisco, todos con antecedentes penales previos (“Does It Pay to Plead Guilty? Differential 
Sentencing and the Functioning of Criminal Courts”, Law and Society Rev., 1981-1982: 45- 
69). ¿Sugieren estos datos que la proporción de todos los acusados en estas circunstancias 
que se declaran culpables y son enviados a prisión difiere de la proporción que son envia¬ 
dos a prisión después de declararse inocentes y que son encontrados culpables? 


Declaración 


Culpable No culpable 


Número de encontrados culpables m = 191 n = 64 

Número de sentenciados a prisión jc = 101 y = 56 

Proporción muestral p x = 0.529 p 2 = 0.875 


Sean p l y p 2 las dos proporciones de población. Fas hipótesis de interés son H 0 \ /?, — 
p 2 = 0 contra H¿. p x — p 2 V 0. Al nivel 0.01, H 0 debe ser rechazada si z > z 0 005 = 2.58 o si 
Z S -2.58. Fa estimación combinada de la proporción de éxitos común es p = (101 + 
56)/(191 + 64) = 0.616. El valor del estadístico de prueba es 

0.529 - 0.875 -0.346 

/ TI F\ ~~ 0.070 ~~ 4 ' 94 

Jmmo .384)(—+ -) 

Como —4.94 < —2.58, // 0 debe ser rechazada. 

El valor P para una prueba z de dos colas es 

Valor P = 2[1 - <i>(|z|)] = 2[1 - $(4.94)] < 2[1 - $(3.49)] = 0.0004 

Una tabla normal estándar más extensa da valor P ~ 0.0000006. Este valor P es tan mi¬ 
núsculo que a cualquier nivel razonable a, H 0 deberá ser rechazada. Eos datos sugieren 
fuertemente que p x =f= p 2 y, en particular, que declararse culpable al inicio puede ser una 
buena estrategia por lo que se refiere a evitar el encarcelamiento. 

El artículo citado también reporta datos sobre acusados en varios otros condados. Los 
autores dividieron los datos por tipo de crimen (robo con allanamiento de morada o robo) y 
por naturaleza de antecedentes previos (ninguno, alguno pero sin prisión y prisión). En todos 
los casos, la conclusión fue la misma. Entre los acusados encontrados culpables, aquellos que 
se declararon así tuvieron menos probabilidades de ser sentenciados a prisión ■ 

Probabilidades de error de tipo II y tamaños de muestra 

En este caso la determinación de (3 es un poco más tediosa de lo que fue para otras pruebas 
con muestra grande. La razón es que el denominador de Z es una estimación de la desviación 
estándar d ep — p 2 , suponiendo que p í = p-, = p. Cuando H 0 es falsa,/), — /V debe ser rees¬ 
tandarizada por medio de 



¡Pi<li 

! Pl<l2 

\¡ m 

n 


(9.6) 
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La forma de cr implica que (3 no es una función de sólo p¡ — p 2 , de modo que se la denota 
como ¡3(p u p 2 )■ 




Comprobación Para la prueba de cola superior (// a : p t — p 2 > 0), 


P(PvPi) = p 


Pl ~P2<Za 




(Pi 


- Pi ~ (Pi ~ Pi )) 


cr 


< 


Za -\¡ 

pq 

íi + í ) 

\m n) 

- (Pi ~ Pi) 



(T 

. 



Cuando m y n son grandes 

p = + np 2 )/(m + n) ~ {mp { + np 2 )/(tn + n) =p 

y q ~ q, la cual da la expresión previa (aproximada) para j8 (p ít p 2 ). ■ 

Alternativamente, pañi p ¡ especificada. p 2 con p¡ — p 2 = d, se pueden determinar los 
tamaños de muestra necesarios para obtener ¡3 (p 1; p 2 ) = ¡3. Por ejemplo, para la prueba de 
cola superior, se iguala ~Zp al argumento de <!>(•) (es decir, lo que está entre paréntesis) en 
el recuadro siguiente. Si m = n, existe una expresión simple para el valor común. 


En el caso m = n, la prueba a nivel a tiene una probabilidad de error de tipo II [3 con 

valores alternativos de p v p 2 con p¡ — p 1 = d cuando 

_ _ 2 

kM/b + Pi)(q\ + ? 2 ) /2 + Z B Vp 1 q l + p 2 q 2 ] 
n = - - -- (9.7) 

Para una prueba de cola superior o inferior, con a/2 reemplazando a a para una prue¬ 
ba de dos colas. 
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Ejemplo 9.12 


e 
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Una de las aplicaciones verdaderamente impresionantes de la estadística ocurrió en cone¬ 
xión con el diseño de experimento y análisis de la vacuna Salk contra la polio en 1954. Una 
parte del experimento se enfocó en la eficacia de la vacuna en el combate de la polio para¬ 
lítica. Debido a que se pensó que sin un grupo de control de niños, no habría una base sóli¬ 
da para evaluar la vacuna, se decidió administrar la vacuna a un grupo y una inyección 
placebo (visualmente indistinguible de la vacuna pero que no tiene ningún efecto) a un gru¬ 
po de control. Por razones éticas y también porque se pensaba que el conocimiento de la ad¬ 
ministración de la vacuna podría afectar el tratamiento y diagnóstico, el experimento se 
llevó a cabo de una manera doblemente a ciegas. Es decir, ninguno de los individuos que 
recibieron inyecciones ni los que la administraron en realidad sabían quién estaba reci¬ 
biendo la vacuna y quién estaba recibiendo el placebo (las muestras fueron numéricamen¬ 
te codificadas); recuerde que en ese momento no estaba del todo claro si la vacuna era 
benéfica. 

Sean p x y p 2 las probabilidades de que un niño contraiga polio paralítica en las condi¬ 
ciones de control y tratamiento, respectivamente. El objetivo era probar H 0 : p x — p 2 = 0 con¬ 
tra H¿. p¡ — p 2 > 0 (la alternativa afirma que es menos probable que un niño vacunado 
contraiga polio que un niño no vacunado). Suponiendo que el valor verdadero de p l es 0.0003 
(un coeficiente de incidencia de 30 por cada 100 000), la vacuna sería una mejora significa¬ 
tiva si el coeficiente de incidencia se reducía a la mitad, es decir, p 2 = 0.00015. Con una prue¬ 
ba a un nivel a = 0.05, sería entonces razonable requerir tamaños de muestra con los cuales 
¡3 = 0.1 cuando = 0.0003 y p 2 = 0.00015. Si se suponen tamaños de muestra iguales, el 
tamaño n se obtiene con (9.7) como 

_ [ 1 , 645 \/( 0 . 5 )( 0 . 00045 )( 1 . 99955 ) + 1 . 28 V ( 0 . 00015 )( 0 . 99985 ) + ( 0 . 0003 )( 0 . 9997)] 2 

( 0.0003 - 0 . 00015) 2 

= [( 0.0349 + 0 . 0271 )/ 0 . 00015] 2 ~ 171000 

Los datos reales para este experimento son los siguientes. Se utilizaron tamaños de 
muestra de aproximadamente 200 000. El lector puede verificar con facilidad que z = 6.43, 
un valor muy significativo. ¡La vacuna fue un rotundo éxito! 

Placebo: m = 201 229, x = número de casos de polio paralítica =110 

Vacuna: n = 200 745, y = 33 ■ 

Intervalo de confianza con muestra grande para p 1 - p 2 

Como con las medias, muchos problemas de dos muestras implican el objetivo de comparación 
mediante pruebas de hipótesis, pero en ocasiones una estimación de intervalo para p x — p 2 es 
apropiada. Tanto p { = Xlm y p 2 = Yin tienen distribuciones aproximadamente normales cuan¬ 
do tanto m como n son grandes. Si se identifica 0 con p x — p 2 , entonces 0 = p x — p 2 satisface 
las condiciones necesarias a fin de obtener un intervalo de confianza para muestra grande. En 
particular, la desviación estándar estimada de0 es V(/)| q jm) + (p 2 q 2 /n). El intervalo 0 ± 
z a/2 •&() de 100(1 — a)% se vuelve entonces 



P\~Pl- Za/ 2 ~ 


nrzr~ 

/V /V 

/ Pi<h 

P202 

/ 

+ 

V m 

n 


Obsérvese que la desviación estándar estimada de p x — p 2 (la expresión de la raíz cuadrada) 
es diferente aquí de lo que fue para probar hipótesis cuando A 0 = 0. 

Investigaciones recientes han demostrado que el nivel de confianza para el intervalo de 
confianza tradicional que se acaba de dar en ocasiones se desvía sustancialmente del nivel 
nominal (el nivel que se piensa se va obtener cuando se utiliza un valor crítico z particular, 
p. ej., 95% cuando z n/2 = 1.96). Se dice que la mejora sugerida es agregar un éxito y una 
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falla a cada una de las muestras y luego reemplazar las p y q en la fórmula anterior por 
p y q donde p 1 = (x + 1 )/(m + 2), etc. Este intervalo también puede ser utilizado cuando 
los tamaños de muestra son bastante pequeños. 

Ejemplo 9.13 Los autores del artículo “Adjuvant Radiotherapy and Chemotherapy in Node-Positive Pre- 
menopausal Women with Breast Cáncer” (New Engl. J. ofMed., 1997: 956-962) reportó los 
resultados de un experimento diseñado para comparar el tratamiento de pacientes con cán¬ 
cer con sólo quimioterapia con un tratamiento combinado de quimioterapia y radiación. De 
las 154 pacientes que recibieron el tratamiento de sólo quimioterapia, 76 sobrevivieron por 
lo menos 15 años, en tanto que 98 de las 164 pacientes que recibieron el tratamiento híbrido 
sobrevivieron por lo menos ese número de años. Con p x denotando la proporción de todas las 
mujeres que, cuando fueron tratadas con sólo quimioterapia, sobreviven por lo menos 15 
años y p 2 denotando la proporción análoga para el tratamiento híbrido, p x = 76/154 = 0.494 
y 98/164 = 0.598. Un intervalo de confianza para la diferencia entre proporciones basadas 
en la fórmula tradicional con un nivel de confianza de aproximadamente 99% es 

0.494 - 0.598 ± (2.58) A Q - 494 >( Q - 506 i + (0-598)(0. 402) = _ Q m ± 0 143 = (-0.247,0.039) 
\/ 154 164 

Al nivel de confianza de 99%, es factible que —0.247 < P\ ~ p 2 < 0.039. Este intervalo es 
ancho de manera razonable, un reflejo del hecho de que los tamaños de muestra no son terri¬ 
blemente grandes para este tipo de intervalo. Obsérvese que 0 es uno de los valores factibles 
de p x — p 2 , lo que sugiere que ningún tratamiento puede ser juzgado superior al otro. Con 
p x = 77/156 = 0.494, q ] = 79/156 = 0.506, /T, = 0.596, q 2 = 0.404 con base en tamaños de 
muestra de 156 y 166, respectivamente, el intervalo “mejorado” aquí es idéntico al interva¬ 
lo anterior. ■ 

Inferencias basadas en muestras pequeñas 

En ocasiones una inferencia con respecto a p x — p 2 es posible que tenga que basarse en 
muestras donde por lo menos un tamaño de muestra es pequeño. Los métodos apropiados 
para tales situaciones no son directos como aquellos para muestras grandes y existe más 
controversia entre estadísticos en cuanto a los procedimientos recomendados. Una prueba 
utilizada con frecuencia, llamada prueba de Fisher-Irwin, se basa en la distribución hiper- 
geométrica. Su amigable estadístico vecino puede ser consultado para más información. 



EJERCICIOS Sección 9.4 (47-56) 

i 


47 . ¿Es menos probable que alguien que cambia de marca por 
cuestiones financieras permanezca leal, que alguien que 
cambia sin pensar en cuestiones financieras? Sean p 1 y p 2 
las proporciones verdaderas de los que cambian a cierta 
marca con o sin pensar en cuestiones financieras, respec¬ 
tivamente, que después repiten una compra. Pruebe H 0 : 
Pj — p 2 = 0 contra H a : p l — p 2 < 0 con a = 0.01 y los 
siguientes datos: 

m = 200 número de éxitos = 30 
n = 600 número de éxitos =180 

(Datos similares aparecen en "Impact of Deais and Deal Re- 
traction on Brand Switching”, J. Marketing, 1980: 62-70.) 

48 . Una muestra de 300 residentes adultos urbanos de un esta¬ 
do particular reveló que 63 estaban a favor de incrementar 
el límite de velocidad en las autopistas de 55 a 65 mph, en 
tanto que una muestra de 180 residentes rurales arrojó que 


75 estaban a favor del incremento. ¿Indican estos datos que 
el sentimiento en cuanto a incrementar el límite de veloci¬ 
dad es diferente en los dos grupos de residentes? 

a. Pruebe H 0 \ p¡ = p 2 contra p l # p 2 con a = 0.05, 
donde p l se refiere a la población urbana. 

b. Si las proporciones verdaderas que favorecen el incre¬ 
mento en realidad son p l = 0.20 (urbanos) y p 2 = 0.40 
(rurales), ¿cuál es la probabilidad de que H 0 sea recha¬ 
zada si se utiliza una prueba a nivel 0.05 con m = 300, 
n = 180? 

49 . Se cree que la portada y la naturaleza de la primera pregun¬ 
ta en encuestas por correo influyen en la proporción de res¬ 
puestas. El artículo “The Impact of Cover Design and First 
Questions on Response Rates for a Mail Survey of Skydi- 
vers” (Leisure Sciences, 1991: 67-76) puso a prueba esta 
teoría experimentando con diferentes diseños de portadas. 
Una era simple, la otra utilizaba la imagen de un paracaidista. 
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Los investigadores especularon que la proporción de res¬ 
puestas sería más baja con la portada simple. 


Portada 

Número enviado 

Número regresado 

Simple 

207 

104 

Paracaidista 

213 

109 


¿Confirman estos datos la hipótesis de los investigadores? 
Pruebe la hipótesis pertinente con a = 0.10 calculando pri¬ 
mero un valor P. 

50. ¿Consideran los maestros que su trabajo es remunerativo y 
satisfactorio? El artículo “Work-Related Attitudes” (Psycho- 
logical Reports, 1991: 443-450) reporta los resultados de 
una encuesta de 395 maestros de primaria y 266 maestros 
de preparatoria. De los maestros de primaria, 224 dijeron 
que estaban muy satisfechos con su trabajo, en tanto que 126 
de los maestros de preparatoria estaban muy satisfechos 
con su trabajo. Calcule las diferencias entre la proporción de 
todos los maestros de primaria que están satisfechos y todos 
los maestros de preparatoria que están satisfechos calculan¬ 
do e interpretando un intervalo de confianza. 

51. Olestra es un sustituto de grasa aprobado por la FDA para 
usarse en bocadillos. Como ha habido reportes anecdóticos 
de problemas gastrointestinales asociados con el consumo de 
olestra, se realizó un experimento de control con placebo do¬ 
blemente a ciegas aleatorizado para comparar las papas fritas 
con olestra con las regulares, con respecto a síntomas gastroin¬ 
testinales (“Gastrointestinal Symptoms Following Consump- 
tion of Olestra on Regular Triglyceride Potato Chips”, J. ofthe 
Amer. Med. Assoc., 1998: 150-152). Entre 529 individuos en el 
grupo de control con las papas regulares 17.6% experimenta¬ 
ron un evento gastrointestinal adverso, en tanto que entre los 
563 individuos en el grupo de tratamiento con papas olestra, 
el 15.8% experimentó dicho evento. 

a. Realice una prueba de hipótesis al nivel de significación 
de 5% para decidir si la proporción de incidencia de pro¬ 
blemas gastrointestinales en aquellos que consumen pa¬ 
pas con olestra de acuerdo con el régimen experimental 
difiere de la proporción de incidencia con el tratamiento 
de control con papas regulares. 

b. Si los porcentajes verdaderos con los dos tratamientos 
fueron 15% y 20%, respectivamente, ¿qué tamaños de 
muestra (m = n) serían necesarios para detectar seme¬ 
jantes diferencias con probabilidad de 0.90? 

52. Cada vez se presta más atención a la radiación ionizante co¬ 
mo un método para preservar productos hortícolas. El artícu¬ 
lo “The Influence of Gamma-Irradiation on the Storage Life 
of Red Variety Garlic” (7. of Food Processing and Preserva- 
don , 1983: 179-183) reporta que 153 de 180 bulbos de ajo 
irradiados estaban en condición de ser vendidos (sin retoños, 
sin podredumbre o ablandamiento externos) 240 días des¬ 
pués del tratamiento, en tanto que sólo 119 de 180 bulbos no 
tratados estaban vendibles después de este lapso de tiempo. 
¿Sugieren estos datos que la radiación ionizante es benéfica 
por lo que se refiere a su condición para ser vendidos? 

53. En investigaciones médicas, la proporción 0 = pfp 2 a menu¬ 
do es de más interés que la diferencia p l — p 2 (p. ej., ¿qué tan 
probable es que los individuos que recibieron el tratamiento 1 


se recuperen como aquellos que recibieron el tratamiento 2?) 
Sea 6 = Pi/p 2 - Cuando tanto m como n son grandes, el esta¬ 
dístico ln(tf) tiene aproximadamente una distribución normal 
con valor medio aproximado ln(ú) y desviación estándar 
aproximada [(m — x)l(mx ) + (n — y)/(ny)] 1/2 . 

a. Use estos datos para obtener una fórmula para intervalo 
de confianza de 95% de muestra grande para calcular el 
ln(0) y luego un intervalo de confianza para 6 mismo. 

b. Regrese a los datos de ataque cardiaco del ejemplo 1.3 y 
calcule un intervalo de valores factibles de 6 al nivel de 
confianza de 95%. ¿Qué sugiere este intervalo sobre la 
eficacia del tratamiento con aspirina? 

54. En ocasiones algunos experimentos que implican éxitos o fallas 
se realizan en pares o de una manera antes/después. Suponga 
que antes de un discurso político importante dado por un can¬ 
didato político, se seleccionan n individuos y se les preguntó si 
están a favor del candidato (E) o no ( F). Luego después del dis¬ 
curso a las mismas n personas se les hizo la misma pregunta. 
Las respuestas pueden ser ingresadas en una tabla como sigue: 


E 

Antes 

F 


donde X 1 + X 2 + X¡ + X 4 = n. Sean p ít p 2 , p 3 y p 4 las cua¬ 
tro probabilidades de las celdas, de modo que p 1 = P(E an¬ 
tes y E después), y así sucesivamente. Se desea probar la 
hipótesis de que la proporción de simpatizantes (E) después 
del discurso no se ha incrementado contra la alternativa de 
que sí se ha incrementado. 

a. Formule las dos hipótesis de interés en función de p 2 , 
PiYPa- 

b. Construya un estimador de la diferencia antes/después 
en probabilidades de éxito. 

c. Cuando n es grande, se puede demostrar que la variable 
aleatoria (X¡ — Xf/n tiene de manera aproximada una 
distribución normal con varianza dada por \p¡ + p¡ ~ 
( p¡ — Pj) 2 \ln. Use esto para construir un estadístico de 
prueba con aproximadamente una distribución estándar 
normal cuando H 0 es verdadera (el resultado se llama 
prueba de McNemar). 

d. Si .tq = 350, x 2 = 150, x 3 = 200 yr 4 = 300, ¿qué con¬ 
cluye? 

55. Se han utilizado dos tipos diferentes de aleación, A y B, pa¬ 
ra fabricar especímenes experimentales de un pequeño esla¬ 
bón sometido a tensión utilizado en una aplicación de 
ingeniería. Se determinó la resistencia última (kfb/pulg 2 ) 
de cada espécimen y los resultados se resumen en la distri¬ 
bución de frecuencia adjunta. 


A_B 

26 - < 30 6 4 

30-<34 12 9 

34-<38 15 19 

38-<42 7 10 

m = 40 n — 42 


Después 
E F 


Al X 2 


X 3 X 4 
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Calcule un intervalo de confianza de 95% para la diferencia 
entre las proporciones verdaderas de todos los especímenes 
de aleaciones A y B que tienen una resistencia última de por 
lo menos 34 klb/pulg 2 . 

56. Con la fórmula tradicional, se tiene que construir un interva¬ 
lo de confianza de 95% para p¡ — p 2 con base en tamaños de 


muestra iguales de las dos poblaciones. ¿Con qué valor de 
n(~ ni) tendrá el intervalo resultante un ancho de cuando mu¬ 
cho 0.1 independientemente de los resultados del muestreo? 


9.5 Inferencias sobre dos varianzas de población 

De vez en cuando se requieren métodos de comparar dos varianzas de población (o desviacio¬ 
nes estándar), aunque tales problemas surgen con mucho menor frecuencia que aquellos que 
implican medias o proporciones. Para el caso en que las poblaciones investigadas son norma¬ 
les, los procedimientos están basados en una nueva familia de distribuciones de probabilidad. 

La distribución F 

La distribución de probabilidad F tiene dos parámetros, denotados por iq y v 2 . El parámetro 
iq se conoce como numerador de número de grados de libertad y v 2 es el número de denomi¬ 
nador de grados de libertad', en este caso iq y v 2 son enteros positivos. Una variable aleatoria 
que tiene una distribución F no puede asumir un valor negativo. Como la función de densidad 
es complicada y no será utilizada en forma explícita, se omite la fórmula. Existe una impor¬ 
tante conexión entre una variable F y variables ji al cuadrado. Si X¡ y X 2 son variables aleato¬ 
rias ji cuadradas independientes con iq y v 2 grados de libertad, respectivamente, entonces la 
variable aleatoria 




X 2 /v 2 


(9.8) 


se puede demostrar que la razón de las dos variables ji cuadradas divididas entre sus respec¬ 
tivos grados de libertad tiene una distribución F. 

La figura 9.8 ilustra la gráfica de una función de densidad F típica. Análoga a la no¬ 
tación t a v y x 2 a v i se utiliza F a v para el punto sobre el eje que captura a del área bajo la 
curva de densidad F, con iq y v 2 grados de libertad en la cola superior. La curva de densidad 
no es simétrica; así que parecería que tanto los valores críticos de cola superior como los de 
cola inferior deben ser tabulados. Esto no es necesario, debido a la siguiente propiedad. 


O 


Curva de densidad F con 
v x y grados de libertad 


Área sombreada = a 



Figura 9.8 Curva de densidad F y valor crítico. 


F i 


—a,V\,v 2 


1/F„ 


(9.9) 
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TEOREMA 


O 


Ejemplo 9.14 
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La tabla A.9 del apéndice da F av¡Vi con a = 0.10, 0.05, 0.01 y 0.001 y varios valores 
de v 1 (en diferentes columnas de la tabla) y v 2 (en diferentes grupos de filas de la tabla). Por 
ejemplo, ,F 0056 10 = 3.22 y F 005 l06 = 4.06. Para obtener F 095 6 10 , el número que captura 
0.95 del área a su derecha (y por tanto 0.05 a la izquierda) bajo la curva F con v l = 6 y 
v 2 = 10, se utiliza (9.9): F 0 95 6 l0 = ^ 0 . 05 , 10,6 = 1/4.06 = 0.246. 

Métodos inferenciales 

Un procedimiento de prueba de hipótesis por lo que se refiere a la razón a\l<r\ así como 
también un intervalo de confianza para esta razón están basados en el siguiente resultado. 


Sea X¡, . . ., X m una muestra aleatoria de una distribución normal con varianza a], sea 
7j,..., Y n otra muestra aleatoria (independiente de las X¡) de una distribución normal 
con varianza crj, y sean S 2 ¡ y S 2 las dos varianzas muéstrales. Entonces la variable 
aleatoria 


F = 



(9.10) 


tiene una distribución F con v { = m — 1 y v 2 = n — 1. 


Este teorema se obtiene al combinar (9.8) con el hecho de que cada una de las variables 
(m — 1 )S\lcr\ y (n — I )S\hr\ tienen una distribución ji cuadrada con m — 1 y n — 1 gra¬ 
dos de libertad, respectivamente (véase la sección 7.4). Como F incluye una razón en lugar 
de una diferencia, el estadístico de prueba es la razón de varianzas muéstrales. La preten¬ 
sión de que crj = a\ es entonces rechazada si la razón difiere en gran medida de 1. 


O 


Prueba Fpara igualdad de varianzas 
Hipótesis nula: H 0 : a\ = cr 2 
Valor estadístico de prueba: / = s\/s\ 

Región de rechazo para una prueba de nivel a 
F 

J a./íi— \,n— 1 

f ^1— a,m— l,n— 1 

® í 1,/i I t) / — \ lj;-l 

Como los valores críticos se tabulan sólo para a = 0.10, 0.05, 0.01 y 0.001, la prue¬ 
ba de dos colas se realiza sólo a los niveles 0.20, 0.10, 0.02 y 0.002. Con software 
estadístico se obtienen otros valores críticos F. 


Hipótesis alternativa 

H., a\ > <t\ 

H ¿- ví < v\ 

v] * a\ 


Con base en los datos reportados en un artículo de 1979 que apareció en el Journal ofGeron- 
tology (“Serum Ferritin in an Elderly Population”, págs. 521-524), los autores concluyeron 
que la distribución de ferritina en los adultos mayores tenía un varianza más pequeña en los 
adultos jóvenes (la ferritina en suero se utiliza para diagnosticar deficiencia de hierro). Para 
una muestra de 28 varones adultos mayores, la desviación estándar de ferritina en suero (mg/1) 
fue .v, = 52.6; para 26 adultos jóvenes, la desviación estándar fue s 2 = 84.2. ¿Confirman estos 
datos la conclusión tal como se aplicó a hombres? 
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Sean u\ y cr\ las varianzas de las distribuciones de ferritina en suero para adultos ma¬ 
yores y adultos jóvenes, respectivamente. Se desea probar H 0 : cr 2 = ít\ contra H á : cr\ < u\. 
Al nivel 0.01, H 0 será rechazada si /< F 0 99 27 25 . Para obtener el valor crítico, se requiere 
Fq oí 2527 ' En la tabla A.9 del apéndice, Í 0012527 = 2.54, por lo tanto L 0992725 = 1/2.54 = 
0.394. El valor calculado de F es (52.6) 2 /(84.2) 2 = 0.390. Como 0.390 < 0.394, H 0 es 
rechazada al nivel 0.01 en favor de f/ ;l , ya que la variabilidad parece ser más grande en adul¬ 
tos jóvenes que en adultos mayores. ■ 

Valores P para pruebas F 

Recuérdese que el valor P para una prueba t de cola superior es el área bajo la curva t per¬ 
tinente (aquella con un grado de libertad apropiado) a la derecha de la t calculada. Del mis¬ 
mo modo, el valor P para una prueba F de cola superior es el área bajo la curva F con grados 
de libertad apropiados en el numerador y denominador a la derecha de la/calculada. La fi¬ 
gura 9.9 ilustra esto para una prueba basada en v 1 = 4 y v 2 = 6, 





La tabulación de áreas de cola superior bajo una curva F es mucho más tediosa que 
para curvas t porque dos grados de libertad están implicados. Con cada combinación de v 1 
y v 2 , la tabla !■ da sólo cuatro valores críticos que capturan las áreas 0.10, 0.05, 0.01 y 0.001. 
La figura 9.10 muestra lo que se puede decir sobre el valor P según donde quede/con res¬ 
pecto a los cuatro valores críticos. 


Vi 



valor P >0.10 


0.01 < valor P < 0.05 


0.001 < valor P < 0.01 


valor P < 0.001 


0.05 < valor P < 0.10 


Figura 9.10 Obtención de información sobre el valor Pe n la tabla Fpara un prueba Fde cola superior. 
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Por ejemplo, para una prueba con v { = 4 y v 2 = 6, 


/ = 5.70 => 0.01 < valor P< 0.05 
/ = 2.16 => valor P > 0.10 
/ = 25.03 => valor P < 0.001 


Sólo si/es igual a un valor tabulado se obtiene un valor P exacto (p. ej., si/= 4.53, enton¬ 
ces el valor P = 0.05). Una vez que se sabe que 0.01 < valor P < 0.05, H 0 sería rechazada 
a un nivel de significación de 0.05, pero no a un nivel de 0.01. Cuando el valor P < 0.001, 
H 0 deberá ser rechazada a cualquier nivel de significación razonable. 

Todas las pruebas F discutidas en capítulos subsiguientes serán de cola superior. Sin 
embargo, si una prueba F de cola inferior es apropiada, entonces (9.9) deberá ser utilizada 
para obtener valores críticos de cola inferior de modo que se pueda establecer un límite o lí¬ 
mites en el valor P. En el caso de una prueba de dos colas, el límite o límites de una prue¬ 
ba de una cola deberán ser multiplicados por 2. Por ejemplo, si/ = 5.82 cuando ^ = 4y 
v 2 — 6, entonces puesto que 5.82 queda entre los valores críticos 0.05 y 0.01, 2(0.01) < va¬ 
lor P < 2(0.05), es decir 0.02 < valor P < 0.10, H 0 sería rechazada si a = 0.10 pero no si 
a = 0.01. En este caso, no se puede decir con base en la tabla qué conclusión es apropiada 
cuando a = 0.05 (puesto que no se sabe si el valor P es más pequeño o más grande que 
éste). Sin embargo, el software estadístico muestra que el área a la derecha de 5.82 bajo es¬ 
ta curva F es 0.029, de modo que el valor P es 0.058 y que por consiguiente la hipótesis nu¬ 
la no debe ser rechazada al nivel 0.05 (0.058 es el a más pequeño con el cual H 0 puede ser 
rechazada y el a seleccionado es más pequeño que éste). Varios programas de computado¬ 
ra estadísticos, desde luego, proporcionan un valor P exacto para cualquier prueba F. 


Intervalo de confianza para a^la 2 


O 


El intervalo de confianza para se basa en el reemplazo de F en el enunciado de pro¬ 

babilidad 



con la variable F (9.10) y en la manipulación de las desigualdades para aislar cr\lcr\. Se ob¬ 
tiene un intervalo para cr/cr, al tomar la raíz cuadrada de cada límite. Los detalles se dejan 
para un ejercicio. 


EJERCICIOS Sección 9.5 (57-64) 


57. Obtenga o calcule las siguientes cantidades: 

a - ^0.05,5,8 b. ^*0.05,8,5 C - ^0.95,5,8 ti- ^0.95,8,5 

e. El percentil 99 de la distribución F con v t = 10, v 2 = 12 

f. El percentil uno de la distribución F con v¡ = 10, v 2 = 12 

g. P(F < 6.16) para v 1 = 6, v 2 — 4 

h. P{Q.\11 < F < 4.74) para v x = 10, v 2 = 5 


60. Remítase al ejemplo 9.7. ¿Sugieren los datos que la desvia¬ 
ción estándar de la distribución de resistencia de especíme¬ 
nes sometidos a un proceso de fusión es más pequeña que 
la de especímenes no sometidos a un proceso de fusión? 
Realice una prueba de significación con 0.01 obteniendo 
tanta información como pueda sobre el valor P. 


con nivel de significación de 0.10 para ver si las desviacio¬ 
nes estándar de población de los dos grupos de edad son di¬ 
ferentes (las curvas de probabilidad normal confirman la 
suposición de normalidad necesaria). 


58. Dé tanta información como pueda sobre el valor P de la 
prueba F en cada una de las siguientes situaciones: 

a. v 1 = 5, v 2 = 10, prueba de cola superior,/= 4.75 

b. v l = 5, v 2 = 10, prueba de cola superior,/= 2.00 

c. v 1 = 5, v 2 = 10, prueba de dos colas, /= 5.64 

d. v l = 5, v 2 = 10, prueba de cola inferior, /= 0.200 

e. v 1 = 35, v 2 = 20, prueba de cola superior, /= 3.24 


61. El toxafen es un insecticida que ha sido identificado como 
contaminante en el ecosistema de los Grandes Lagos. Para 
investigar el efecto de la exposición al toxafen en animales, 
a grupos de ratas se les administró toxafen en su dieta. El 
artículo “Reproduction Study of Toxaphene in the Rat” 


59. Regrese a los datos sobre ángulo de inclinación máximo da¬ 
dos en el ejercicio 28 de este capítulo. Realice una prueba 
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(7. of Environ. Sci. Health, 1988: 101-126) reporta aumen¬ 
tos de peso (en gramos) de ratas a las que se les administró 
una dosis baja (4 ppm) y de ratas de control cuya dieta no 
incluía el insecticida. La desviación estándar de muestra de 
23 ratas hembra de control fue de 32 g y de 20 ratas hem¬ 
bra sometidas a dosis bajas fue de 54 g. ¿Sugieren estos da¬ 
tos que existe más variabilidad en los incrementos de peso 
a dosis bajas que en los incrementos de peso en las ratas de 
control? Suponiendo normalidad, realice una prueba de hi¬ 
pótesis con un nivel de significación de 0.05. 

62. En un estudio de deficiencia de cobre en ganado, se deter¬ 
minaron los valores de cobre (/ug Cu/100 mi de sangre) tan¬ 
to para ganado apacentado en un área donde se sabe que 
existen anomalías bien definidas provocadas por molibdeno 
(valores de contenido del metal que exceden el rango nor¬ 
mal de variación regional) y para ganado apacentado en área 
sin anómala. (“An Investigation into Copper Deficiency in 
Cattle in the Southern Pennines”, 7. Agricultural Soc. Cam¬ 
bridge, 1972: 157-163), con el resultado s l = 21.5 (m = 48) 
en la condición anómala y s 2 = 19.45 (n = 45) para la 


condición no anómala. Pruebe en cuanto a igualdad con¬ 
tra desigualdad de varianzas de población a un nivel de sig¬ 
nificación de 0.10 utilizando el método del valor P. 

63. El artículo "Enhancement of Compressive Properties of 
Failed Concrete Cylinders with Polymer Impregnation” (7. 
Testing and Evaluation, 1977: 333-337) reporta los siguien¬ 
tes datos sobre módulo de compresión impregnado (lb- 
/pulg 2 X 10 s ) cuando se utilizaron dos polímeros diferentes 
para reparar grietas en concreto que falló. 

Epoxy 1.75 2.12 2.05 1.97 

Prepolímero MMA 1.77 1.59 1.70 1.69 

Obtenga un IC del 90% para el radio de varianzas para el 
primer uso del método sugerido en el texto para obtener una 
fórmula general para el intervalo de confianza. 

64. Reconsidere los datos del ejemplo 9.6 y calcule un límite de 
confianza superior de 95% para la razón de la desviación 
estándar de la distribución de porosidad en triacetato a la de 
de la distribución de porosidad en algodón. 


EJERCICIOS SUPLEMENTARIOS (65-93) 


65. Los datos adjuntos sobre resistencia a la compresión (Ib) de 
cajas de 12 X 10 X 8 pulg aparecieron en el artículo “Com- 
pression of Single-Wall Corrugated Shipping Containers 
Using Fixed and Floating Test Platens” (7. Testing and Eva¬ 
luation, 1992: 318-320). Los autores manifestaron que 
encontraron que la diferencia entre la resistencia a la com¬ 
presión utilizando un método de platinas fijas y flotantes es 
pequeña comparada con la variación normal de la resisten¬ 
cia a la compresión entre cajas idénticas. ¿Está de acuerdo? 

¿Su análisis se basa en cualquier suposición? 

Tamaño de Media DE 

Método muestra muestral muestral 

Fijo 10 807 27 67. 

Flotante 10 757 41 


66 . Los autores del artículo “Dynamics of Canopy Structure 
and Light Interception in Pinus elliotti, North Florida” 

(Ecological Monographs, 1991: 33-51) idearon un experi¬ 
mento para determinar el efecto de un fertilizante en un área 
cubierta de hojas. Se dispuso de varios solares para el estu¬ 
dio y se seleccionó al azar la mitad para fertilizarlos. Para 
asegurarse de que los solares que iban a recibir el fertilizan¬ 
te y los de control fueran iguales antes de comenzar el 
experimento se registró la densidad de árboles (el número 68 . 
de árboles por hectárea) en ocho solares que iban a ser fer¬ 
tilizados y en ocho solares de control y se obtuvieron los 
resultados siguientes generados por MINITAB. 


Solares fertilizados 

1024 

1216 

1312 

1280 


1216 

1312 

992 

1120 

Solares de control 

1104 

1072 

1088 

1328 


1376 

1280 

1120 

1200 


Muestra T para fertilizados y de control 

N Media DevEst EE de la Media 

fertilizado 8 1184 126 44 

control 8 1196 118 42 

IC de 95% para mu ferlizado-mu de control: 
(-144, 120) 

a. Construya una gráfica de caja comparativa y comente 
sobre cualquier característica interesante. 

b. ¿Concluiría que existe una diferencia significativa en la 
densidad de árboles media en los solares fertilizados y de 
control? Use a = 0.05. 

c. Interprete el intervalo de confianza dado. 

¿Se ve afectada la proporción de respuestas a cuestionarios 
si se incluye un incentivo por responder junto con el cues¬ 
tionario? en un experimento, de 110 cuestionarios sin in¬ 
centivo 75 fueron regresados, en tanto que 98 cuestionarios 
que incluían la oportunidad de ganar un premio de lotería 
dieron por resultado 66 respuestas (“Charities, No; Lotte- 
ries, No; Cash, Yes”, Public Opinión Quarterly, 1996: 542- 
562). ¿Sugieren estos datos que la inclusión de un incentivo 
incrementa la probabilidad de una respuesta? Formule y 
pruebe las hipótesis pertinentes a un nivel de significación 
de 0.10 utilizando el método del valor P. 

Los datos adjuntos se obtuvieron en un estudio para evaluar el 
potencial de licuefacción en una planta de energía nuclear 
propuesta (“Cyclic Strenghts Compared for Two Sampling 
Techniques”, 7. Geotechnical División, Amer. Soc. Civil 
Engrs. Proceedings, 1981: 563-576). Antes de probar la 
resistencia cíclica, se recopilaron muestras de suelo me¬ 
diante un método de jarro y un método de bloque y se 
obtuvieron los siguientes valores observados de densidad 
en seco (lb/pie 3 ). 
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Muestreo con jarro 101.1 

111.1 

107.6 

98.1 

99.5 

98.7 

103.3 

108.9 

109.1 

104.1 

110.0 

98.4 

105.1 

104.5 

105.7 

103.3 

100.3 

102.6 

101.7 

105.4 

99.6 

103.3 

102.1 

104.3 

Muestreo con bloque 107.1 

105.0 

98.0 

97.9 

103.3 

104.6 

100.1 

98.2 

97.9 

103.2 

96.9 



Calcule e interprete un intervalo de confianza de 95% para 
la diferencia entre densidades en seco promedio verdaderas 
para los dos métodos de muestreo. 

69. El artículo “Quantitative MRI and Electrophysiology of 
Preoperative Carpal Tunnel Syndrome in a Female Popula- 
tion” ( Ergonomics , 1997: 642-649) reportó que (—473.3, 
1691.9) era un intervalo de confianza de 95% con muestra 
grande para la diferencia entre el volumen del músculo té- 
nar (mm 3 ) en personas que padecen el síndrome de túnel 
carpiano y el volumen promedio verdadero en personas que 
no padecen el síndrome. Calcule un intervalo de confianza 
de 90% para esta diferencia. 

70. Los siguientes datos de resistencia a la flexión (lb-pulg- 
/pulg) de juntas se tomaron del artículo “Bending Strength 
of Comer Joints Constructed with Injection Molded Spli- 
nes” (Forest Products J., abril de 1997: 89-92). 

Tamaño de Media DE 
Tipo muestra muestra! muestral 

Sin recubrimiento lateral 10 80.95 9.59 

Con recubrimiento lateral 10 63.23 5.96 


a. Calcule un límite de confianza inferior de 95% para la re¬ 
sistencia promedio verdadera de juntas con recubrimien¬ 
to lateral. 

b. Calcule un límite de predicción inferior de 95% para la 
resistencia de una sola junta con recubrimiento lateral. 

c. Calcule un intervalo que, con confianza de 95%, incluye 
los valores de resistencia de por lo menos 95% de la po¬ 
blación de todas las juntas con recubrimientos laterales. 

d. Calcule un intervalo de confianza de 95% para la dife¬ 
rencia entre las resistencias promedio verdaderas de los 
dos tipos de juntas. 

71. Se realizó un experimento para comparar varias propiedades 
de hilo terminado retorcido de algodón/poliéster con suavi¬ 
zante únicamente e hilo terminado con suavizante más 5% 
de resina DP (“Properties of a Fabric Made with Tándem 
Spun Yams”, Textile Res. J., 1996: 607-611). Una caracterís¬ 
tica importante en particular de telas es su durabilidad; es 
decir, su capacidad de resistir el desgaste. Para una muestra de 
40 especímenes tratado con suavizante, la resistencia a la 
abrasión por flexión media (ciclos) en la dirección de relle¬ 
no del hilo fue de 3975.0, con una desviación estándar de 
245.1. Otra muestra de especímenes tratados con suavizante 
y resina dieron una media y desviación estándar de 2795.0 y 
293.7, respectivamente. Calcule un intervalo de confianza 
con nivel de confianza de 99% para la diferencia entre resis¬ 
tencias a la abrasión promedio verdaderas para los dos tipos 


de telas. ¿Proporciona su intervalo evidencia convincente de 
que las resistencias promedio verdaderas difieren para los 
dos tipos de tela? ¿Por qué sí o por qué no? 

72. El descarrilamiento de un tren de carga provocado por la ca¬ 
tastrófica falla de la chumacera de la armadura de un motor 
de tracción motivó un estudio reportado en el artículo “Lo- 
comotive Traction Motor Armature Bearing Life Study” 
(Lubrication Engr. agosto de 1997: 12-19). Se seleccionó 
una muestra de 17 motores de tracción con alto kilometraje 
y se determinó la penetración de cono (mm/10) tanto en la 
chumacera de piñón como en la chumacera de la armadura 
del conmutador y se obtuvieron los siguientes datos: 


Motor 



1 

2 

3 

4 

5 

6 

Conmutador 

211 

273 

305 

258 

270 

209 

Piñón 

226 

278 

259 

244 

273 

236 




Motor 




7 

8 

9 

10 

11 

12 

Conmutador 

223 

288 

296 

233 

262 

291 

Piñón 

290 

287 

315 

242 

288 

242 




Motor 




13 

14 

15 

16 

17 


Conmutador 

278 

275 

210 

272 

264 


Piñón 

278 

208 

281 

274 

268 



Calcule la diferencia media de la población entre la penetra¬ 
ción en la chumacera de la armadura del conmutador y la 
penetración en la chumacera de piñón y hágalo de manera 
que permita obtener información sobre confiabilidad y pre¬ 
cisión de la estimación. [Nota: Una curva de probabilidad 
normal valida la suposición de normalidad necesaria.] ¿Di¬ 
ría que la diferencia media de la población ha sido estima¬ 
da con precisión? ¿Difiere la media de la población para los 
dos tipos de chumaceras? Explique. 

73. La “cabezabilidad” es la capacidad de una pieza cilindrica 
de permitir que se le dé la forma de la cabeza de un perno, 
tornillo u otra parte formada en frío sin rotura. El artículo 
“New Methods for Assessing Coid Heading Quality” (Wire 
J. Intl., octubre de 1996: 66-72) describe el resultado de una 
prueba de impacto de cabezabilidad aplicada a 30 especí¬ 
menes de acero muerto al aluminio y a 30 especímenes de 
acero muerto al silicio. El número de clasificación de cabe¬ 
zabilidad medio para los especímenes de acero fue de 6.43 
y la media para los especímenes de aluminio fue de 7.09. 
Suponga que las desviaciones estándar fueran de 1.08 y 
1.19, respectivamente. ¿Está de acuerdo con los autores del 
artículo de que la diferencia en las clasificaciones de cabe¬ 
zabilidad es significativa al nivel de 5% (suponiendo que las 
dos distribuciones de cabezabilidad son normales? 

74. El artículo “Two Parameters Limiting the Sensitivity of Labo- 
ratory Tests of Condoms as Viral Barriere” ( J. ofTesting and 
Eval., 1996: 279-286) reportó que, en los condones de la mar¬ 
ca A, entre 16 rasgaduras producidas por una aguja, la longi¬ 
tud media de las rasgaduras fue de 74.0 ¿un, en tanto que para 
las 14 rasgaduras producidas en la marca B, la longitud media 
fue de 61.0 ¿un (determinadas con un microscopio luminoso 
y micrografos de exploración de electrones. Suponga que las 
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desviaciones estándar son 14.8 y 12.5, respectivamente (con¬ 
sistentes como los rangos muéstrales dados en el artículo). 
Los autores comentaron que el condón de la marca B más 
grueso mostró una longitud de rasgadura media más pequeña 
que el condón de la marca A más delgado. ¿Es en realidad es¬ 
ta diferencia estadísticamente significativa? Formule las hipó¬ 
tesis apropiadas y pruebe a un nivel a = 0.05. 

75. Se requiere información sobre la postura de la mano y las 
fuerzas generadas por los dedos durante la manipulación de 
varios objetos cotidianos para diseñar prótesis de alta tecno¬ 
logía para la mano. El artículo “Grip Posture and Forces 
During Holding Cylindrical Objects with Circular Grips” 
( Ergonomics , 1996: 1163-1176) reportó que para una mues¬ 
tra de 11 mujeres, la fuerza de opresión con cuatro dedos 
(N) fue de 98.1 y la desviación estándar fue de 14.2. Para 
una muestra de 15 hombres, la media y la desviación están¬ 
dar fueron de 129.2 y 39.1, respectivamente. 

a. Una prueba realizada para ver si las fuerzas promedio ver¬ 
daderas para los dos géneros eran diferentes dio por resul¬ 
tado t = 2.51 y valor P = 0.019. ¿Da el procedimiento de 
prueba apropiado descrito en este capítulo este valor de t 
y el valor P establecido? 

b. ¿Existe evidencia sustancial para concluir que la fuerza 
promedio verdadera para hombres excede la de la fuer¬ 
za de mujeres por más de 25 N? Formule y pruebe las 
hipótesis pertinentes. 

76. El artículo “Pine Needles as Sensors of Atmospheric Pollu- 
tion” ( Environ. Monitoring, 1982: 273-286) reportó sobre el 
uso de análisis de actividad de neutrones para determinar 
concentración de contaminantes en hojas de pino. De acuer¬ 
do con los autores del artículo, “Estas observaciones indican 
fuertemente que para aquellos elementos bien determinados 
mediante procedimientos analíticos, la distribución de con¬ 
centración es lognormal. Por consiguiente, en pruebas de sig¬ 
nificación se utilizarán logaritmos de concentraciones”. Los 
datos dados se refieren a concentración de bromo en hojas de 
pino tomadas del sitio cercano a una planta de vapor alimen¬ 
tada con petróleo y de un sitio relativamente limpio. Los va¬ 
lores dados a continuación son medias y desviaciones 
estándar de las observaciones logarítmicas transformadas. 

Desv. est. de 

Tamaño de Concentración concentración 

Sitio muestra log media media 

Planta de vapor 8 18.0 4.9 

Limpia 9 11.0 4.6 

Sea ¡i* la concentración log promedio verdadera en el pri¬ 
mer sitio y defínase /a? análogamente para el segundo sitio. 

a. Use la prueba t agrupada (basada en la suposición de 
normalidad v desviaciones estándar iguales) para decidir 
un nivel de significación de 0.05 si las dos medias de 
distribución de concentración son iguales. 

b. Si cr * y a*, las desviaciones estándar de las dos distri¬ 
buciones log de concentración, no son iguales, ¿serían 
/Aj y /a 2 , las medias de las distribuciones de concentra¬ 
ción, las mismas si /a* = /a*? Explique su razonamiento. 

77. La exposición a largo plazo de trabajadores textiles al polvo 
de algodón emitido durante el procesamiento puede producir 
problemas de salud sustanciales, de modo que los investiga¬ 


dores textiles han estado investigando métodos que reduzcan 
los riesgos al mismo tiempo que preserven propiedades 
importantes de las telas. Los datos adjuntos de resistencia co¬ 
hesiva de primera torsión (kN-m/kg) en especímenes produ¬ 
cidos con cinco múltiplos de torsión diferentes se tomaron 
del artículo “Heat Treatment of Cotton Effect on Endotoxin 
Contení, Fiber and Yam Properties, and Processability” (Tex- 
tile Research , J., 1996: 727-738). 

Torsión múltiple 

1.054 1.141 1.245 1.370 1.481 

Resistencia de control 0.45 0.60 0.61 0.73 0.69 

Resistencia en caliente 0.51 0.59 0.63 0.73 0.74 

Los autores del artículo citado manifestaron que la resisten¬ 
cia de especímenes tratados resultó ser un poco más alta en 
promedio la de especímenes de control. ¿Es la diferencia 
estadísticamente significativa? Formule y pruebe las hipóte¬ 
sis pertinentes con a = 0.05 calculando el valor P. 

78 . Los datos adjuntos sobre la razón de resistencia con respec¬ 
to al área de sección transversal de los extensores de la ro¬ 
dilla se tomaron del artículo “Knee Extensor and Knee 
Flexor Strength: Cross Sectional Area Ratios in Young and 
Elderly Men” (J. of Gerontology, 1992: M204-M210). 

Tamaño de Media Error 

Grupo muestra muestral estándar 

Jóvenes 13 7.47 0.22 

Hombres mayores 12 6.71 0.28 

¿Sugieren estos datos que la razón promedio verdadera pa¬ 
ra jóvenes excede aquella para hombres mayores? Realice 
una prueba de hipótesis apropiada con a = 0.05. Asegúre¬ 
se de formular cualquier suposición necesaria para su aná¬ 
lisis. 

79 . Los datos adjuntos sobre tiempo de respuesta aparecieron 
en el artículo “The Extinguishment of Fires Using Low- 
Flow Water Hose Streams-Part II" IFire Technology , 1991: 
291-320). 

Buena visibilidad 0.43 1.17 0.37 0.47 0.68 0.58 0.50 2.75 

Mala visibilidad 1.47 0.80 1.58 1.53 4.33 4.23 3.25 3.22 

Los autores analizaron los datos con una pmeba t agrupada. 
¿Parece justificado el uso de esta prueba? [ Sugerencia : Verifi¬ 
que en cuanto a normalidad. Las anotaciones normales con n 
= 8 son -1.53, -0.89, -0.49, -0.15,0.15,0.49,0.89 y 1.53.] 

80 . Comúnmente se utiliza cemento aerifico para hueso en la 
artroplastia total de articulaciones como un material que 
permite la transferencia suave de cargas de una prótesis 
metálica a una estructura ósea. El artículo “Validation of 
the Small-Punch Test as a Technique for Characterizing the 
Mechanical Properties of Acrylic Bone Cement” ( J. of 
Engr. in Med., 2006: 11-21) dio los siguientes datos sobre 
fuerza de ruptura (N): 


Temp. 

Media 

11 

X 

s 

22° 

Seca 

6 

170.60 

39.08 

37° 

Seca 

6 

325.73 

34.97 

22° 

Húmeda 

6 

366.36 

34.82 

37° 

Húmeda 

6 

306.09 

41.97 
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Suponga que todas las distribuciones de población son 
normales. 

a. Estime la diferencia entre fuerza de ruptura promedio 
verdadera en un medio seco a 37° y hágalo de una for¬ 
ma que dé información sobre precisión y confiabilidad. 
Luego interprete su estimación. 

b. Estime la diferencia entre la fuerza a la ruptura promedio 
verdadera en un medio seco a 37° y la fuerza promedio ver¬ 
dadera a la misma temperatura en un medio húmedo y 
hágalo de modo que obtenga información sobre precisión 
y confiabilidad. Luego interprete su estimación. 

c. ¿Existe una fuerte evidencia para concluir que la fuerza 
promedio verdadera en un medio seco a la temperatura 
más alta excede aquella a la temperatura más baja por más 
de 100 N? 

81. En un experimento para comparar resistencias de apoyo de 
clavijas insertadas en dos tipos diferentes de soportes de mon¬ 
taje, una muestra de 14 observaciones de límite de esfuerzo 
de soportes de montaje de encino rojo dieron por 
resultado una media y desviación estándar de 8.48 MPa y 
0.79 MPa, respectivamente, en tanto que una muestra de 12 
observaciones cuando se utilizaron soportes de montaje de 
abeto Douglas dieron una media de 9.36 y una desviación 
estándar de 1.52 (“Bearing Strength of White Oak Pegs in 
Red Oak and Douglas Fir Timbers”, J. of Testing and Eva- 
luation , 1998, 109-114). Considere probar si o no los límites 
de esfuerzo promedio verdaderos son idénticos para los dos 
tipos de soporte de montaje. Compare los grados de libertad 
y valores P para las pruebas t agrupadas y no agrupadas. 

82. ¿Cómo se compara la absorción de energía con el consumo 
de energía? Un aspecto de este tema se consideró en el ar¬ 
tículo “Measurement of Total Energy Expenditure by the 
Doubly Labelled Water Method in Professional Soccer Pla- 
yers” (J. of Sports Sciences, 2002: 391-397), el cual contie¬ 
ne los datos adjuntos (MJ/día) 

Jugador 

1 2 3 4 5 6 7 

Consumo 14.4 12.1 14.3 14.2 15.2 15.5 17.8 

Absorción 14.6 9.2 11.8 11.6 12.7 15.0 16.3 

Pruebe si existe una diferencia significativa entre absorción 
y consumo. ¿Depende la conclusión de si se utiliza un nivel 
de significación de 0.05, 0.01 o 0.001? 

83. Un experimentador desea obtener un intervalo de confianza 
para la diferencia entre resistencia a la ruptura promedio 
verdadera para cables fabricados por la compañía I y la 
compañía II. Suponga que la resistencia a la ruptura está 
normalmente distribuida para ambos tipos de cable con 
o-j = 30 lb/pulg 2 y cr, = 20 lb/pulg 2 . 

a. Si los costos dictan que el tamaño de muestra para el ca¬ 
ble de tipo I deberá ser tres veces el tamaño de muestra 
para el cable de tipo II, ¿cuántas observaciones se re¬ 
quieren si el intervalo de confianza de 99% no debe ser 
más ancho que 20 lb/pulg 2 ? 

b. Suponga que se tienen que hacer un total de 400 obser¬ 
vaciones. ¿Cuántas de ellas deberán ser hechas en mues¬ 
tras de cable de tipo I si el ancho del intervalo resultante 
tiene que ser mínimo? 
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84 . En el artículo “Development Rates and a Temperatura-De- 
pendent Model of Pales Weevil” ( Environ. Entomology, 
1987: 956-962) se describe un experimento para determinar 
los efectos de la temperatura en la sobrevivencia de huevos 
de insectos. A 11°C, 73 de 91 huevos sobrevivieron hasta la 
siguiente etapa de desarrollo. A 30°C, 102 de 110 huevos 
sobrevivieron. ¿Sugieren los resultados de este experimento 
que la tasa de sobrevivencia (proporción de sobrevivencia) 
difiere para las dos temperaturas? Calcule el valor P y utilí¬ 
celo para probar las hipótesis apropiadas. 

85 . Los meseros en restaurantes han empleado varias estrate¬ 

gias para incrementar las propinas. Un artículo en el ejem¬ 
plar del 5 de septiembre de 2005 del The New Yorker 
reportó que “En un estudio una mesera recibió 50% más en 
propinas cuando se presentó con su nombre que cuando no 
lo hizo”. Considere los siguientes datos (ficticios) sobre la 
cantidad de propina como un porcentaje de la cuenta. 
Presentación: m = 50 X = 22.63 í¡ = 7.82 

Sin presentación: n = 50 y = 14.15 s 2 = 6.10 

¿Sugieren estos datos que una presentación incrementa las 
propinas en promedio en más de 50%. Formule y pruebe 
las hipótesis pertinentes. [ Sugerencia: Considere el paráme¬ 
tro 6 = — 1.5¿i 2 .] 

86. El artículo “Quantitative Assessment of Glenohumeral Trans- 
lation in Baseball Players” ( The Amer. J. of Sports Med., 
2004: 1711-1715) consideró varios aspectos de movimiento 
del hombro para una muestra de pitcheres (lanzadores) y otra 
muestra de jugadores de campo (“glenohumeral” que se re¬ 
fiere a la articulación entre el húmero (bola) y el glenoide 
(cuenca). Los autores amablemente proporcionaron los si¬ 
guientes datos sobre traslación anteroposterior (mm), una 
medida de la extensión del movimiento anterior y posterior, 
tanto del brazo dominante como del brazo no dominante. 



Pos Dom Tr 

Pos ND Tr 

Pit Dom Tr 

Pit ND Tr 

1 

30. 

.31 

32. 

.54 

27 . 

.63 

24. 

.33 

2 

44 . 

.86 

40. 

.95 

30. 

.57 

26. 

.36 

3 

22 . 

.09 

23. 

.48 

32. 

.62 

30. 

.62 

4 

31, 

.26 

31. 

. 11 

39. 

.79 

33. 

.74 

5 

28, 

.07 

28. 

.75 

28. 

.50 

29. 

.84 

6 

31. 

.93 

29. 

.32 

26. 

.70 

26. 

.71 

7 

34. 

.68 

34. 

.79 

30. 

.34 

26. 

.45 

8 

29. 

.10 

28. 

.87 

28. 

.69 

21. 

.49 

9 

25. 

.51 

27 . 

.59 

31 

.19 

20. 

.82 

10 

22 . 

.49 

21. 

.01 

36. 

.00 

21. 

.75 

11 

28. 

.74 

30. 

.31 

31 

.58 

28. 

.32 

12 

27 . 

.89 

27 . 

.92 

32. 

.55 

27 . 

.22 

13 

28. 

.48 

27 . 

.85 

29. 

.56 

28. 

.86 

14 

25. 

.60 

24. 

.95 

28. 

.64 

28. 

.58 

15 

20. 

.21 

21 

.59 

28. 

.58 

27 . 

.15 

16 

33 . 

.77 

32. 

.48 

31 

.99 

29. 

.46 

17 

32 . 

.59 

32. 

.48 

27 . 

.16 

21. 

.26 

18 

32 . 

.60 

31. 

.61 





19 

29. 

.30 

27 . 

.46 





Media 

29. 

.4463 

29. 

.2137 

30. 

.7112 

26. 

6447 

de 

5. 

.4655 

4. 

.7013 

3 . 

,3310 

3 . 

.6679 


a. Estime la diferencia promedio verdadera de traslación 
entre los brazos dominante y no dominante de lanzado¬ 
res en una forma que aporte información sobre confiabi¬ 
lidad y precisión e interprete la estimación resultante. 

b. Repita (a) para jugadores de campo. 

c. Los autores afirmaron que los “lanzadores mostraron 
una mayor diferencia en la traslación anteroposterior de 
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lado a lado de sus hombros en comparación con los ju¬ 
gadores de campo”. ¿Está de acuerdo? Explique. 

87. Suponga que se tiene que realizar una prueba al nivel 0.05 
de H 0 : /r¡ — ¿i 2 = 0 contra H. á : /jt l — /x 2 > 0, suponiendo 
(Tj = <t 2 = 10 y normalidad para ambas distribuciones, 
utilizando tamaños de muestra iguales ( m = n). Evalúe la 
probabilidad de un tipo de error II cuando ¿q — /u 2 =lyn = 
25, 100, 2500 y 10 000. ¿Puede pensar en problemas reales 
en los cuales la diferencia /jl ¡ — ¡jl 2 ~ 1 tiene poca signifi¬ 
cación práctica? ¿Serían deseables tamaños de muestra de 
n = 10 000 en tales problemas? 

88. Los siguientes datos se refieren a la cuenta de bacterias 
transportadas por el aire (número de colonias/pie 3 ) tanto pa¬ 
ra m = 8 cuartos de hospital alfombrados como para n = 8 
cuartos no alfombrados (“Microbial Air Sampling in a Car- 
peted Hospital”, J. Environmental Health, 1968: 405). ¿Pa¬ 
rece haber una diferencia en el conteo de bacterias 
promedio verdadero entre cuartos alfombrados y no alfom¬ 
brados? 

Alfombrado 11.8 8.2 7.1 13.0 10.8 10.1 14.6 14.0 

No alfombrado 12.1 8.3 3.8 7.2 12.0 11.1 10.1 13.7 

Suponga que posteriormente se dio cuenta que los cuartos 
alfombrados estaban en un hospital de veteranos, en tanto 
que los no alfombrados estaban en un hospital infantil. ¿Se¬ 
ría capaz de evaluar el efecto del alfombrado? Comente. 

89 . Investigadores enviaron 5000 currículos en respuesta a 
anuncios de trabajo que aparecieron en el Boston Globe y el 
Chicago Tribune. Los currículos eran idénticos excepto que 
2500 de ellos tenían apellidos “que sonaban a apellidos de 
persona blanca”, tales como Brett y Emily, en tanto que los 
otros 2500 tenían nombres “que sonaban a persona negra” 
tales como Tamika y Rasheed. Los currículos del primer ti¬ 
po produjeron 250 respuestas y los del segundo tipo sólo 
167 respuestas (estos números son muy consistentes con la 
información que apareció en un reporte del 15 de enero 
de 2003 de la Associated Press). ¿Sugieren fuertemente 
estos datos que un currículo con un apellido “negro” es menos 
probable que dé por resultado una respuesta que un currículo 
con un apellido de “blanco”? 

90 . La prueba de McNemar, desarrollada en el ejercicio 54, 
también puede ser utilizada cuando los individuos son reu¬ 
nidos en pares para obtener n pares y luego un miembro de 
cada par recibe el tratamiento 1 y el otro el tratamiento 2. 
Luego Xj es el número de pares en los que ambos tratamien¬ 
tos fueron exitosos y asimismo para X 2 , X 3 , X 4 . El estadístico 
de prueba para comprobar la eficacia de los dos tratamientos 
está dado por (X 2 — X 3 )/V(X 2 + X 3 ), el cual tiene aproxima¬ 
damente una distribución normal estándar cuando H 0 es 
verdadera. Úselo para probar si la ergotamina es efectiva en 
el tratamiento de dolores de cabeza de migraña. 


Placebo 


Ergotamina 



E 

F 

E 

44 

34 

F 

46 

30 


Los datos son ficticios, pero la conclusión concuerda con la 
del artículo “Controlled Clinical Trial of Ergotamine Tartra- 
te” (. British Med. 1970: 325-327). 

91 . El artículo “Evaluating Variability in Filling Operations” 
( Food Tech., 1984: 51-55) describe dos operaciones de lle¬ 
nado diferentes utilizadas en una planta empacadora de car¬ 
ne molida. Ambas operaciones de llenado se ajustaron para 
llenar paquetes con 1400 g de carne molida. En una mues¬ 
tra aleatoria de tamaño 30 tomada de cada operación de lle¬ 
nado, las medias y desviaciones estándar resultantes fueron 
1402.24 g y 10.97 g para la operación 1 y 1419.63 g y 9.96 
g para la operación 2. 

a. ¿Con un nivel de significación de 0.05, ¿existe suficien¬ 
te evidencia que indique que el peso medio verdadero de 
los paquetes difiere para las dos operaciones? 

b. ¿Sugieren los datos de la operación 1 que el peso medio 
verdadero de los paquetes producidos por la operación 1 
es más grande por más de 1400 g? Use un nivel de sig¬ 
nificación de 0.05. 

92 . Sea X,,. . ., X m una muestra aleatoria de una distribución de 
Poisson con parámetro A 3 y sea Y¡,, Y n una muestra alea¬ 
toria de otra distribución de Poisson con parámetro A 2 . Se de¬ 
sea probar H 0 \ A 3 — A 2 = 0 contra una de las tres alternativas 
estándar. Como /x = A para una distribución de Poisson, 
cuando m y n son grandes se puede utilizar la prueba z con 
muestra grande de la sección 9.1. Sin embargo, el hecho de 
que V(X) = A In sugiere que se_debe utilizar un denominador 
diferente al estandarizar X — Y. Desarrolle un procedimien¬ 
to de prueba con muestra grande apropiado para este proble¬ 
ma y luego aplíquelo a los siguientes datos para probar si las 
densidades de plantas de una especie particular son iguales 
en dos regiones diferentes (donde cada observación es el nú¬ 
mero de plantas encontradas en un cuadrante de muestreo lo¬ 
calizado al azar con área de 1 m 2 , así que en la región 1 hubo 
40 cuadrantes en los que se observó una planta, etcétera): 


Frecuencia 


0 1234567 

Región 1 28 40 28 17 8 2 1 1 m= 125 

Región 2 14 25 30 18 49 2 1 1 n = 140 


93 . Remitiéndose al ejercicio 92, desarrolle una fórmula para el 
intervalo de confianza con muestra grande para A 3 — A 2 . 
Calcule el intervalo para los datos dados allí utilizando un 
nivel de confianza de 95%. 


Bibliografía 


Véase la bibliografía al final del capítulo 7. 
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Análisis de la varianza 


INTRODUCCIÓN 

Al estudiar los métodos de análisis de datos cuantitativos, primero se trataron pro¬ 
blemas que implican una sola muestra de números y luego se abordó el análisis com¬ 
parativo de dos muestras diferentes. En problemas de una muestra, los datos se 
componían de observaciones sobre respuestas de individuos u objetos experimenta¬ 
les seleccionados de una sola población. En problemas de dos muestras, las dos 
muestras se tomaron de dos poblaciones diferentes y los parámetros de interés fue¬ 
ron las medias de la población o bien se aplicaron dos tratamientos distintos a unida¬ 
des experimentales (individuos u objetos) seleccionados de una sola población; en el 
último caso, los parámetros de interés fueron las medias de tratamiento verdaderas. 

El análisis de la varianza, o más brevemente, ANOVA, se refiere en general a 
un conjunto de situaciones experimentales y procedimientos estadísticos para el aná¬ 
lisis de respuestas cuantitativas de unidades experimentales. El problema ANOVA 
más simple se conoce indistintamente como unifactorial, de clasificación única o 
ANOVA unidireccional e implica el análisis de datos muestreados de más de dos po¬ 
blaciones (distribuciones) numéricas o de datos de experimentos en los cuales se uti¬ 
lizaron más de dos tratamientos. La característica que diferencia los tratamientos o 
poblaciones una de otra se llama factor en estudio y los distintos tratamientos o po¬ 
blaciones se conocen como niveles del factor. Ejemplos de tales situaciones incluyen 
los siguientes: 

1. Un experimento para estudiar los efectos de cinco marcas diferentes de gasolina 
con respecto a la eficiencia de operación de un motor automotriz (mpg). 

2. Un experimento para estudiar los efectos de la presencia de cuatro soluciones 
azucaradas diferentes (glucosa, sucrosa, fructosa y una mezcla de las tres) en 
cuanto a crecimiento de bacterias. 
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3. Un experimento para investigar si la concentración de madera dura en la pulpa (%) 
afecta la resistencia a la tensión de bolsas hechas de la pulpa. 

4. Un experimento para decidir si la densidad de color de un espécimen de tela depen¬ 
de de la cantidad de tinte utilizado. 

En 1) el factor de interés es la marca de la gasolina y existen cinco niveles diferen¬ 
tes del factor. En 2) el factor es el azúcar con cuatro niveles (o cinco, si se utiliza una so¬ 
lución de control que no contenga azúcar). Tanto en 1) como en 2), el factor es de 
naturaleza cualitativa y los niveles corresponden a posibles categorías del factor. En 3) 
y 4), los factores son concentración de madera dura y cantidad de tinte, respectivamen¬ 
te; estos dos factores son de naturaleza cuantitativa, por lo que los niveles identifican 
diferentes ajustes del factor. Cuando el factor de interés es cuantitativo, también se 
pueden utilizar técnicas estadísticas de análisis de regresión (discutido en los capítulos 
12 y 13) para analizar los datos. 

Este capítulo se enfoca en el ANOVA unifactorial. La sección 10.1 presenta la 
prueba F para probar la hipótesis nula de que las medias de la población o tratamien¬ 
to son idénticas. La sección 10.2 considera un análisis adicional de los datos cuando H 0 
ha sido rechazada. La sección 10.3 se ocupa de algunos otros aspectos del ANOVA uni¬ 
factorial. El capítulo 11 introduce experimentos ANOVA que implican más de un factor. 


| 10.1 ANOVA unifactorial 

El ANOVA unifactorial se enfoca en la comparación de más de dos medias de población o 
tratamiento. Sean 

I = el número de poblaciones o tratamientos que se están comparando, 
yi j = la media de la población 1 o la respuesta promedio verdadera cuando se aplica 
el tratamiento 1. 


¡jb, = la media de la población I o la respuesta promedio verdadera cuando se aplica el 
tratamiento I. 

Las hipótesis pertinentes son 

H 0 - Ai ~ A 2 — — A/ 

contra 

H¿. por lo menos dos de las p., son diferentes. 

Si I = 4, H 0 es verdadera sólo si las cuatro p, son idénticas. //,, sería verdadera, por ejem¬ 
plo, si /i| = /i, f /i, = p, 4 , si p¡ = p, 3 = p 4 V p, 2 , o si las cuatro ¡jl¡ difieren una de otra. 

Una prueba de estas hipótesis requiere que se tenga disponible una muestra aleatoria 
de cada población o tratamiento. 

Ejemplo 10.1 El artículo “Compression of Single-Wall Corrugated Shipping Containers Using Fixed and 
Floating Test Platens” ( J. Testing and Evaluation, 1992: 318-320) describe un experimen¬ 
to en el cual se compararon varios tipos diferentes de cajas con respecto a resistencia a la 
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compresión (Ib). La tabla 10.1 presenta los resultados de un experimento ANOVA unifacto¬ 
rial que implica 7=4 tipos de cajas (las medias y desviaciones estándar muéstrales con- 
cuerdan con los valores dados en el artículo). 


Tabla 10.1 Datos y cantidades resumidas para el ejemplo 10.1 


Tipo de caja Resistencia a la compresión (Ib) Media muestral DE muestral 


1 

655.5 

788.3 

734.3 

721.4 

679.1 

699.4 

713.00 

46.55 

2 

789.2 

772.5 

786.9 

686.1 

732.1 

774.8 

756.93 

40.34 

3 

737.1 

639.0 

696.3 

671.7 

717.2 

727.1 

698.07 

37.20 

4 

535.1 

628.7 

542.4 

559.0 

586.9 

520.0 

562.02 

39.87 





Gran media = 

682.50 



Con /jLj denotando la resistencia a la compresión promedio verdadera de las cajas de tipo 
i (i = 1, 2, 3, 4), la hipótesis nula es H 0 : = ¡x 2 = ¡i 3 = /jl 4 . La figura 10.1a) muestra una 

gráfica de caja comparativa para las cuatro muestras. Existe una cantidad sustancial de tras¬ 
lape entre las observaciones de los primeros tres tipos de cajas, pero las resistencias a la 
compresión del cuarto tipo parecen considerablemente más pequeñas que para los demás ti¬ 
pos. Esto sugiere que H 0 no es verdadera. La gráfica de caja que aparece en el figura 10.1b) 
está basada en agregar 120 a cada observación en la cuarta muestra (y así se obtiene una me¬ 
dia de 682.02 y la misma desviación estándar) y las demás observaciones no cambian. Ya 
no es obvio si 77 0 es verdadera o falsa. En situaciones como ésta, se requiere un procedimien¬ 
to de prueba formal. 





550 600 650 700 750 

a) 


O 



630 660 690 720 750 780 


b) 

Figura 10.1 Gráficas de caja para el ejemplo 10.1: a) datos originales; b) datos modificados. 
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Notación y suposiciones 

En problemas de dos muestras se utilizaron las letras X y Y para diferenciar las observacio¬ 
nes en una muestra de aquellas en la otra. Como esto es engorroso con tres o más muestras, 
se acostumbra utilizar una sola letra con dos subíndices. El primero identifica el número de 
la muestra, correspondiente a la población o tratamiento que se está muestreando y el se¬ 
gundo denota la posición de la observación dentro de dicha muestra. Sean 

X¡ . = la variable aleatoria (va) que denota la medición y-ésima tomada en la población 
/-ésima o la medición tomada en la unidad experimental y-ésima que recibe el 
tratamiento /-ésimo. 

x¡j = el valor observado de X ; J cuando se realiza el experimento. 

Los datos observados normalmente se muestran en una tabla rectangular, tal como la 
tabla 10.1. En ella las muestras de las diferentes poblaciones aparecen en filas distintas de 
la tabla y x¡j es el número y-ésimo en la fila /-ésima. Por ejemplo x 23 = 786.9 (la tercera ob¬ 
servación de la segunda población) yr 41 = 535.1. Cuando no hay ambigüedad, se escribirá 
x¡j en lugar de x tj (p. ej., si se realizaron 15 observaciones en cada uno de los 12 tratamientos, 
x n2 podría significar x¡ 12 o x 112 ). Se supone que las X¡¡ dentro de cualquier muestra particular 
son independientes, una muestra aleatoria de la distribución de población o tratamiento 
/-ésima, y que las diferentes muestras son independientes entre sí. 

En algunos experimentos, diferentes muestras contienen distintos números de obser¬ 
vaciones. Aquí se abordará el caso de tamaños de muestra iguales; la generalización en 
cuanto a tamaños de muestra desiguales aparece en la sección 10.3. Sea J el número de ob¬ 
servaciones en cada muestra (J = 6 en el ejemplo 10.1). El conjunto de datos se compone 
de IJ observaciones. Las medias de muestra individual serán denotadas por X u , X 2% ,. .., X h . 
Es decir. 


X = 1 


IXtj 


J 


i =1,2, 


El punto en lugar del segundo subíndice significa que se sumaron todos los valores de di¬ 
cho subíndice al mismo tiempo que se mantuvo fijo el valor del otro subíndice y la raya ho¬ 
rizontal indica división entre J para obtener un promedio. Asimismo, el promedio de todas 
las observaciones IJ, llamada gran media, es 

/ j 

I I X t] 

X = - 

IJ 


Con los datos de resistencia en la tabla 10.1, x h = 713.00, x 2 , = 756.93, x 3 . = 698.07, 
3c 4 . = 562.02 y x„ = 682.50. Además, sean S\, S 2 , . . . , Sj las varianzas muéstrales: 

í (.X, - X-) 1 


■S'? = 


- 


J~ 1 


z = 1,2,...,/ 


De acuerdo con el ejemplo 10.1, .v, = 46.55, .vy = 2166.90, y así sucesivamente. 



SUPOSICIONES 


La población o tratamiento I son normales con la misma varianza cr 2 , es decir, cada 
X¡j está normalmente distribuida con 

E(X,j) = ¡X ViXy) = a 2 
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Las desviaciones estándar de la muestra I en general difieren un poco aun cuando las 
u correspondientes sean idénticas. En el ejemplo 10.1, la más grande entre .v h s 2 , s 3 y ,v 4 
es aproximadamente 1.25 veces la más pequeña. Una regla empírica preliminar es que si la s 
más grande no es mucho más de dos veces la más pequeña, es razonable suponer cr 2 iguales. 

En capítulos previos, se sugirió un diagrama de probabilidad normal para verificar en 
cuanto a normalidad. Los tamaños de muestra individuales en ANOVA típicamente son 
demasiado pequeños como para que los distintos diagramas I sean informativos. Se puede 
construir un solo diagrama restando x¡. de cada observación en la primera muestra, x 2 . 
de cada observación en la segunda y así sucesivamente y luego dibujando estas desviacio¬ 
nes IJ contra los percentiles z■ La figura 10.2 da ese diagrama para los datos del ejemplo 
10.1. La linealidad de la gráfica confirma fuertemente la suposición de normalidad. 


Desviación 



Figura 10.2 Diagrama de probabilidad normal basado en los datos del ejemplo 10.1. 

Si la suposición de normalidad o la suposición de varianzas iguales se supone infac¬ 
tible, habrá que emplear un método de análisis distinto de la prueba F usual. Búsquese por 
favor asesoría experta en tales situaciones (en la sección 10.3 se sugiere una posibilidad, una 
transformación de datos). 

El estadístico de prueba 

Si H 0 es verdadera, las J observaciones en cada muestra provienen de una distribución nor¬ 
mal con el mismo valor medio ¡jl, en cuyo caso las medias muéstrales x u , . . . , x¡. deberán 
ser razonablemente parecidas. El procedimiento de prueba se basa en comparar una medi¬ 
da de diferencias entre las x¡, (variación “entre muestras”) con una medida de variación 
calculada desde adentro de cada una de las muestras. 



El cuadrado de la media de tratamientos está dado por 

CMTr - y^y [(!,. - X_f + (X 2 , - X.f + ■ ■ ■ + (X,. - X.f] 


y el cuadrado de la media de error es 


CME 


sj + s\ + • • • + sj 

I 


El estadístico de prueba para ANOVA unifactorial es F = CMTr/CME. 
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La terminología “cuadrado de la media” se explicará en breve. Obsérvese que se utilizan X 
y S 2 mayúsculas, de modo que CMTr y CME se definen como estadísticos. Se seguirá la tra¬ 
dición y también se utilizarán CMTr y CME (en lugar de cmtr y eme) para denotar los 
valores calculados de estos estadísticos. Cada S 2 evalúa la variación dentro de una muestra 
particular, así que CME es una medida de variación dentro de muestras. 

¿Qué clase de valor de F proporciona evidencia en pro o en contra de //,,? Si H 0 es 
verdadera (todas las p, son iguales), los valores de las medias muéstrales individuales debe¬ 
rán estar próximos entre sí y por consiguiente próximos a la gran media, con el resultado de 
un valor pequeño de CMTr. Sin embargo, si las /a, son bastante diferentes, algunas 3c,-. s 
difieren un poco de 3c... De modo que el valor de CMTr es afectado por el estado de H 0 (ver¬ 
dadera o falsa). Este no es el caso con CME, porque las s] dependen sólo del valor subya¬ 
cente de cr 2 y no de donde están centradas las diversas distribuciones. El siguiente recuadro 
presenta una propiedad importante de ¿’(CMTr) y E(CME), los valores esperados de estos 
dos estadísticos. 




PROPOSICIÓN 


Cuando H 0 es verdadera 

£(CMTr) = £(CME) = cr 2 
mientras que cuando H 0 es falsa 

E(CMTr) > E(CME) = a 2 

Es decir, ambos estadísticos son insesgados para estimar la varianza de población co¬ 
mún a 2 cuando H 0 es verdadera, pero CMTr tiende a sobreestimar cr 2 cuando H 0 es 
falsa. 


O 


El insesgamiento de CME es una consecuencia de E(S 2 ) = cr 2 si H 0 es verdadera o falsa. 
Cuando H 0 es verdadera, cada X¡ tiene el mismo valor medio /j, y varianza cr/J de modo que 
2 (A,. — X..) 2 /(I — 1), la “varianza muestral” de las X¡, , estima cr/J insesgadamente; mul¬ 
tiplicando ésta por J se obtiene CMTr como un estimador insesgado de cr 2 misma. Las X¡. 
tienden a dispersarse más cuando H 0 es falsa que cuando es verdadera y tiende a inflar el 
valor de CMTr en este caso. Por consiguiente, un valor de F que excede en gran medida a 1, 
correspondiente a CMTr mucho más grande que CME, provoca una duda considerable so¬ 
bre H 0 . La forma de la región de rechazo es / > c. La c de corte debe ser seleccionada para 
que dé P(F > c cuando H 0 es verdadera) = a, el nivel de significación deseado. Por consi¬ 
guiente, se requiere la distribución de F cuando H 0 es verdadera. 

Distribuciones Fy la prueba F 

En el capítulo 9, se introdujo una familia de distribuciones de probabilidad llamada distri¬ 
buciones F en conexión con una proporción en la cual existe un número de grados de liber¬ 
tad (gl) asociado con el numerador y otro número de grados de libertad asociado con el 
denominador. Sean iq y v 2 el número de grados de libertad asociado con el numerador y de¬ 
nominador, respectivamente, para una variable con una distribución F. Tanto rq como v 2 son 
enteros positivos. La figura 10.3 ilustra una curva de densidad F y el valor crítico de cola 
superior correspondiente, F a . La tabla A. 9 da estos valores críticos para a = 0.10, 0.05, 
0.01 y 0.001. Los valores de iq están identificados con diferentes columnas de la tabla y las 
filas con varios valores de v 2 . Por ejemplo, el valor crítico F que captura un área de cola su¬ 
perior de 0.05 bajo la curva con v¡ = 4 y v 2 = 6 es F 00546 = 4.53 en tanto que F 00564 = 6.16. 
El resultado teórico clave es que el estadístico de prueba F tiene una distribución F cuando 
H 0 es verdadera. 
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TEOREMA 


Ejemplo 10.2 

(continuación 
del ejemplo 
10 . 1 ) 


Curva F con y v 2 grados de libertad 
Área sombreada = a 



Figura 10.3 Una curva F y valor crítico F a m m . 


Sea F = CMTr/CME el estadístico de prueba en un problema de ANOVA unifacto¬ 
rial que implica poblaciones o tratamientos I con una muestra aleatoria de J observa¬ 
ciones de cada uno. Cuando H 0 es verdadera y la suposición básica de esta sección se 
satisface, F tiene una distribución F con v¡ = I — 1 y v 2 = I(J — 1). Con/denotan¬ 
do el valor calculado de F, la región de rechazo/> F al uu ^especifica entonces 
una prueba con nivel de significación a. Remítase a la sección 9.5 para ver cómo se 
obtiene información sobre el valor P para pruebas F. 


El razonamiento para v l = I — 1 es que aunque CMTr está basada en las I desviacio¬ 
nes Xj. — X.., . . . , X¡. — X„, Yi(X¡. — X.) = 0, de modo que sólo I — 1 de éstas son libre¬ 
mente determinadas. Como cada muestra contribuye con J — 1 grados de libertad a CME y 
estas muestras son independientes, v 2 = (J — 1) + • • • + (J — 1) = I(J — 1). 

Los valores de I y J con los datos de resistencia son 4 y 6, respectivamente, de modo 
que grados de libertad = 7—1=3 asociados con el numerador y grados de libertad 
= I(J — 1) = 20 asociados con el denominador. A un nivel de significación de 0.05, 77 0 : 
/j., = ¡± 2 = p. , = /j, 4 será rechazada en favor de la conclusión de que por lo menos dos /a, 
son diferentes si/> f 0053 2n = 3.10. La gran media es x.. = Y.Y,xJ(IJ) = 682.50 

CMTr = J3Y [(713 ' 00 ““ 682 - 5 °) 2 + (756.93 - 682.50) 2 

+ (698.07 - 682.50) 2 + (562.02 - 682.50) 2 ] = 42455.86 

CME = ^-[(46.55) 2 + (40.34) 2 + (37.20) 2 + (39.87) 2 ] = 1691.92 
/= CMTr/CME = 42455.86/1691.92 = 25.09 

Como 25.09 £ 3.10, H 0 es resonantemente rechazada a un nivel de significación de 0.05. 
La resistencia a la compresión promedio verdadera sí parece depender del tipo de caja. En 
realidad, valor P = área bajo la curva F a la derecha de 25.09 = 0.000. H 0 sería rechazada 
a cualquier nivel de significación razonable. ■ 

Sumas de los cuadrados 

La introducción de las sumas de los cuadrados facilita el desarrollo de una apreciación in¬ 
tuitiva para el razonamiento que fundamenta los ANOVA unifactoriales y multifactoriales. 
Sea x¿ la suma (no el promedio, puesto que no hay raya) de las x tj con i fija (suma de los 
números en la i-ésima fila de la tabla) y x.. denota la suma de todas las x :j (el gran total). 
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DEFINICIÓN 


La suma total de los cuadrados (STC), la suma de los cuadrados del tratamiento 
(STC) y la suma de los cuadrados del error (SCE) están dadas por 

STC =1 I (x¡j - x..) 2 = X Yjxfj- ~xl 
i= 1 j= 1 ¡= 1 7=1 IJ 

STC = í t (*,, ~ x.) 2 = -y í x 2 - j-xi 

i= 1 7=1 J i= 1 IJ 

I J J I J 

SCE =Z.Z. (.Xy ~ x,f donde x¡. = Z, x¡¡ x..=Z, Z, Xy 

i= 1 7=1 7=1 i = 1 7=1 



La suma de los cuadrados STC aparece en el numerador de F y SCE lo hace en el denomi¬ 
nador; la razón para definir la STC se pondrá de manifiesto en breve. 

Las expresiones a la extrema derecha de STC y STC son convenientes si los cálculos 
de ANOVA se realizan a mano, aunque la amplia disponibilidad de programas estadísticos ha¬ 
ce que esto sea innecesario. Tanto STC como STC implican x 2 J(IJ) (el cuadrado del gran 
total dividido entre IJ), lo que normalmente se llama factor de corrección para la media 
(FC). Una vez que se calcula el factor de corrección, la STC se obtiene elevando al cuadrado 
cada número que aparece en la tabla, sumando los cuadrados y restando el factor de correc¬ 
ción. STC se obtiene al elevar al cuadrado cada total de fila, sumándolos, dividiendo entre J y 
restando el factor de corrección. 

Una fórmula para calcular SCE es una consecuencia de una relación simple entre las 
tres sumas de cuadrados. 


Identidad fundamental 




STC = STC + SCE 

(10.1) 


Por consiguiente, si se calculan dos cualesquiera de las sumas de los cuadrados, la tercera 
se obtiene con (10.1); STC y STC son las más fáciles de calcular y en ese caso SCE = STC 
— STC. La comprobación se desprende de elevar al cuadrado ambos lados de la relación 

Xy ~ x.. = (Xy ~ x¡.) + (x¡. - xj (10.2) 

y sumando todas las i y j. Esto da la STC a la izquierda y STC y SCE como los dos térmi¬ 
nos extremos a la derecha. Es fácil ver que el término del producto cruz es cero. 

La interpretación de la identidad fundamental es una importante ayuda para entender 
el ANOVA. STC mide la variación total de los datos: la suma de todas las desviaciones al 
cuadrado con respecto a la gran media. La identidad dice que esta variación total puede ser 
dividida en dos partes. SCE mide la variación que estaría presente (en las filas) aun cuando 
H 0 fuera verdadera y es por consiguiente la parte de la variación total que no es explicada 
por la veracidad o la falsedad de H 0 . STC es la cantidad de variación (entre filas) que pue¬ 
den ser explicadas por las posibles diferencias en las /q. Si la variación explicada es grande 
con respecto a la variación no explicada, entonces H 0 es rechazada en favor de H¿. 
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Una vez que STC y SCE se calculan, cada uno se divide por su número de grados de 
libertad asociado para obtener un cuadrado de la media (media en el sentido de promedio). 
Entonces F es la proporción de los dos cuadrados de la media. 


STC 

CMTr = 

CME = SCE 

„ CMTr 

F = __ 

(10.3) 

i -1 

iu - 1) 

CME 


Con frecuencia, los cálculos se resumen en un formato tabular, llamado tabla ANOVA, co¬ 
mo se ilustra en la tabla 10.2. Las tablas producidas por programas estadísticos comúnmen¬ 
te incluyen una columna de valor P a la derecha de/. 


TABLA 10.2 Tabla ANOVA 


Origen de 
la variación 

Grados de 
libertad 

Suma de 

los cuadrados 

Cuadrado de la media 

/ 

Tratamientos 

1 — 1 

STC 

CMTr = STCr/(7 - 1) 

CMTr/CME 

Error 

I(J ~ 1) 

SCE 

CME = SCE/[/(7 - 1)] 


Total 

IJ — 1 

STC 




Los datos adjuntos se obtuvieron con un experimento que compara el grado de manchado 
de telas copolimerizadas con tres mezclas diferentes de ácido metracrílico (datos similares 
aparecieron en el artículo “Chemical Factors Affecting Soiling and Soil Release from Cotton 
DP Fabric”, American DyestuffRepórter, 1983: 25-30). 


Mezcla 1 
Mezcla 2 
Mezcla 3 


0.56 

1.12 

0.90 

1.07 

0.94 

4.59 

0.918 

0.72 

0.69 

0.87 

0.78 

0.91 

3.97 

0.794 

0.62 

1.08 

1.07 

0.99 

0.93 

4.69 

x.. = 13.25 

0.938 



Sea p, el grado de manchado promedio verdadero de manchado cuando se utiliza una mez¬ 
cla i (¿ = 1, 2, 3). La hipótesis nula H 0 : p, l = p 2 = p, manifiesta que el grado de mancha¬ 
do promedio verdadero es idéntico con las tres mezclas. Se realizará una prueba a un nivel 
de significación de 0.01 para ver si H 0 deberá ser rechazada a favor de la aseveración de 
que el grado de manchado promedio verdadero no es el mismo con todas las mezclas. Co¬ 
mo I — 1 = 2 e I(J — 1) = 12, el valor crítico F de la región de rechazo es F 0012l2 = 6.93. 
Elevando al cuadrado cada una de las 15 observaciones y sumando se obtiene 
= (0.56) 2 + (1.12) 2 + • • • + (0.93) 2 = 12.1351. Los valores de las tres sumas de los 
cuadrados son 

STC = 12.1351 - (13.25) 2 /15 = 12.1351 - 11.7042 = 0.4309 
STCr = y [(4.59) 2 + (3.97) 2 + (4.69) 2 ] - 11.7042 

= 11.7650 - 11.7042 = 0.0608 
SCE = 0.4309 - 0.0608 = 0.3701 

El resto de los cálculos se ilustra en la tabla ANOVA adjunta. Como / = 0.99 no es 
por lo menos F 001212 = 6.93. H 0 no es rechazada a un nivel de significación de 0.01. 
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Parece que las mezclas son indistinguibles con respecto al grado de manchado ( F 010 2 ¡2 
2.8 => valor P > 0.10). 


Origen de la variación 

Grados de 
libertad 

Suma de 
los cuadrados 

Cuadrado 
de la media 

/ 

Tratamientos 

2 

0.0608 

0.0304 

0.99 

Error 

12 

0.3701 

0.0308 


Total 

14 

0.4309 




Cuando la prueba F hace que H 0 sea rechazada, con frecuencia al experimentador le 
interesará realizar un análisis más amplio para decidir cuáles de las difieren de cuáles 
otras. El procedimiento para hacer esto se llama procedimientos de comparación múltiple y 
en las dos secciones siguientes se describen varios. 


EJERCICIOS Sección 10.1 (1-10) 


i. 


2 . 


4 . 


En un experimento para comparar las resistencias a la ten¬ 
sión de / = 5 tipos diferentes de alambre de cobre, se utili¬ 
zaron 7 = 4 muestras de cada tipo. Las estimaciones entre 
muestras y dentro de muestras de a 2 se calcularon como 
CMTr = 2673.3 y CME = 1094.2, respectivamente. 

a. Use la prueba F a un nivel de 0.05 para probar H 0 : p.¡ = 
Pi~ Pa~ Ps contra 7/ a : por lo menos dos ¡jl¡ son 
desiguales. 

b. ¿Qué se puede decir sobre el valor P para la prueba? 

Suponga que las observaciones de resistencia a la compre¬ 
sión del cuarto tipo de caja del ejemplo 10.1 hubieran sido 
655.1. 748.7, 662.4, 679.0, 706.9 y 640.0 (obtenidas suman- 


son x¡. = 4.39 (IRS), x 2 . = 4.52 (IRD), x 3 . = 5.49 (IRN), 
x 4 . = 6.36 (C), x„ = 5.19 y = 911.91. Use la prueba 
F ANOVA a un nivel de 0.05 para determinar si existen di¬ 
ferencias entre los tiempos de vuelo promedio verdaderos 
con los cuatro tratamientos. 

5 . Considere los siguientes datos del módulo de elasticidad 
(X 10 6 lb/pulg 2 ) de madera de tres grados diferentes (en con¬ 
cordancia con los valores que aparecen en el artículo, "Ben- 
ding Strength and Stiffness of Second-Growth: Douglas-Fir 
Dimensión Lumber” (Forest Products 7., 1991: 35-43), ex¬ 
cepto que los tamaños de muestra allí eran más grandes): 


3 . 


do 120 a cada x 4j previa). Suponiendo que las observaciones 
restantes no cambian, realice una prueba F con a = 0.05. 

Grado 

J 

x¡. 


1 

10 

1.63 

0.27 

Se determinó el rendimiento en lúmenes de cada uno de 

2 

10 

1.56 

0.24 

7=3 marcas diferentes de focos de luz blanca de 60 watts. 

3 

10 

1.42 

0.26 


con 7=8 focos de cada marca probados. Las sumas de 
los cuadrados se calcularon como SCE = 4773.3 y 
STC = 591.2. Formule las hipótesis de interés (incluidas 
definiciones en palabras de los parámetros) y use la prueba 
F de ANOVA (a = 0.05) para decidir si existen diferencias 
en los rendimientos de lúmenes promedio verdaderos entre 
las tres marcas de este tipo de foco obteniendo tanta infor¬ 
mación como sea posible sobre el valor P. 

En un estudio para evaluar los efectos de la infección de 
malaria en mosquitos huésped (“Plasmodium Cynomolgi: 
Effects of Malaria Infection on Laboratory Flight Perfor¬ 
mance of Anopheles Stephensi Mosquitos”, Experimental 
Parasitology, 1977: 397-404), mosquitos fueron alimentados 
con macacos de la India infecciosos y no infecciosos. Subse¬ 
cuentemente se midió la distancia que volaban durante 24 ho¬ 
ras por medio de un molino de vuelo. Los mosquitos se 
dividieron en cuatro grupos de ocho cada uno: macacos in¬ 
fecciosos y sporozites presentes (IRS), macacos infecciosos 
y oocitos presentes (IRD), macaco infeccioso y ninguna in¬ 
fección desarrollada (IRN) y no infecciosos (C). Los valores 


Use estos datos y nivel de significación de 0.01 para probar 
la hipótesis nula de no diferencia en el módulo de media de 
elasticidad para los tres grados. 

6. El artículo, “Origin of Precambrian Iron Formations” 
(. Econ. Geology, 1964: 1025-1057) reporta los siguientes 
datos sobre Fe total para cuatro tipos de formación de hierro 
(1 = carbonato, 2 = silicato, 3 = magnetita, 4 = hematita). 


1: 

20.5 

28.1 

27.8 

27.0 

28.0 


25.2 

25.3 

27.1 

20.5 

31.3 

2: 

26.3 

24.0 

26.2 

20.2 

23.7 


34.0 

17.1 

26.8 

23.7 

24.9 

3: 

29.5 

34.0 

27.5 

29.4 

27.9 


26.2 

29.9 

29.5 

30.0 

35.6 

4: 

36.5 

44.2 

34.1 

30.3 

31.4 


33.1 

34.1 

32.9 

36.3 

25.5 

Analice i 

con una prueba F 

de va 


cación de 0.01 y resuma los resultados en una tabla ANOVA. 
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7. En un experimento para investigar el desempeño de cuatro 
marcas diferentes de bujías destinadas para usarse en una 
motocicleta de dos tiempos de 125 cc, se probaron cinco 
bujías de cada marca y el número de millas (a una veloci¬ 
dad constante) hasta que se observó una falla. Aquí se da la 
tabla ANOVA parcial para los datos. Llene las entradas que 
faltan, formule las hipótesis pertinentes y realice una prue¬ 
ba para obtener tanta información como sea posible sobre el 
valor P. 

Origen de Grados de Suma de Cuadrado de 
la variación libertad los cuadrados la media / 


Marca 

Error 14713.69 

Total 310500.76 

8. Un estudio de las propiedades de armaduras conectadas con 
placas metálicas para soportar techos (“Modeling Joints 
Made with Light-Gauge Metal Connector Plates”, Forest 
Products J., 1979: 39-44) dio las siguientes observaciones 
de índice de rigidez axial (klb/pulg) de tramos de placa de 
4, 6, 8, 10 y 12 pulg. 


4: 

309.2 

409.5 

311.0 

326.5 

316.8 


349.8 

309.7 




6: 

402.1 

347.2 

361.0 

404.5 

331.0 


348.9 

381.7 




8: 

392.4 

366.2 

351.0 

357.1 

409.9 


367.3 

382.0 




10: 

346.7 

452.9 

461.4 

433.1 

410.6 


384.2 

362.6 




12: 

407.4 

441.8 

419.9 

410.7 

473.4 


441.2 

465.8 
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¿Tiene algún efecto la variación de la longitud de placas en 
la rigidez axial promedio verdadera? Formule y pruebe las 
hipótesis pertinentes mediante un análisis de varianza con 
a = 0.01. Muestre sus resultados en una tabla ANOVA. 
[Sugerencia'. = 5241, 420.79.] 

9. Se analizaron seis muestras de cada uno de cuatro tipos de 
crecimiento de granos de cereal en una región para determi¬ 
nar el contenido de tiamina y se obtuvieron los siguientes 
resultados (p g/g): 


Trigo 

5.2 

4.5 

6.0 

6.1 

6.7 

5.8 

Cebada 

6.5 

8.0 

6.1 

7.5 

5.9 

5.6 

Maíz 

5.8 

4.7 

6.4 

4.9 

6.0 

5.2 

Avena 

8.3 

6.1 

7.8 

7.0 

5.5 

7.2 


¿Sugieren estos datos que por lo menos dos de los granos 
difieren con respecto al contenido de tiamina promedio 
verdadero? Use un nivel a = 0.05 con base en el método 
del valor P. 

10. En ANOVA unifactorial con tratamientos 1 y observaciones 
/por cada tratamiento, sea p = (l//)Zp,- 

a. Exprese E(X,,) en función de p. [Sugerencia'. X.. = 
(|//)EV,,| 

b. Calcule E(X~¡.). [Sugerencia'. Con cualquier variable 
aleatoria Y._E(Y 2 ) = V(Y) + [E{Y)f.[ 

c. Calcule E(X 2 ,). 

d. Calcule £(STCr)y luego demuestre que 

£(CMTr) = a 2 + y^-pZíp, - p) 2 

e. Con el resultado del inciso d) ¿cuál es £(CMTr) cuando 
H 0 es verdadera? Cuando H 0 es falsa, ¿se compara 
E(CMTr) con a 2 '! 



| 10.2 Comparaciones múltiples en ANOVA 

Cuando el valor calculado del estadístico F en un ANOVA unifactorial no es significativo, el 
análisis se termina porque no han identificado diferencias entre las p ; . Pero cuando H 0 es 
rechazada, el investigador normalmente deseará saber cuáles de las ¡jl¡ son diferentes una de 
otra. Un método de realizar este análisis se llama procedimiento de comparaciones múltiples. 

Varios de tales procedimientos más frecuentemente utilizados están basados en la si¬ 
guiente idea central. Primero se calcula un intervalo de confianza para cada diferencia p ; — p 
con i < j. Por consiguiente si I = 4, los seis intervalos de confianza requeridos serían para 
Pi - P 2 (pero no para p 2 - p,), p - p 3 , p - p 4 , p 2 - p 3 , p 2 - p 4 y p 3 - p 4 . Enton¬ 
ces si el intervalo para p — p., no incluye 0, se concluye que p, y p 2 difieren significati¬ 
vamente una de otra, si el intervalo sí incluye 0, se considera que las dos p no difieren de 
manera significativa. Si se sigue la misma línea de razonamiento para cada uno de los 
demás intervalos, finalmente se es capaz de juzgar si cada par de p difieren o no en forma 
significativa una de otra. 

Los procedimientos basados en esta idea difieren en el método utilizado para calcular 
los varios intervalos de confianza. Aquí se presenta un método popular que controla el ni¬ 
vel de confianza simultáneo para todos los intervalos /(/ — l)/2 calculados. 
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Procedimiento de Tukey (el método T) 

El procedimiento de Tukey implica utilizar otra distribución de probabilidad llamada distri¬ 
bución de rango estudentizado. La distribución depende de dos parámetros: un m grado 
de libertad asociado con el numerador y un grado de libertad asociado con el denominador v. 
Sea Q a m v el valor crítico a de cola superior de la distribución de rango estudentizado con m 
grados de libertad asociados con el numerador y v grados de libertad asociados con el de¬ 
nominador (análogo a F a . En la tabla A. 10 se dan valores de Q a m v . 


PROPOSICIÓN 

Con la probabilidad 1 — a, 



X, ~ Xj_ — Q n ii,j i, VCME/7 < p ; — p ; 



^x,-x.+Q aJAJ _ 1) V CMEA/ 

(10.4) 


Para cada i y j (i = 1,...,/ y j = 1,...,/) con i < j. 



Obsérvese que los grados de libertad asociados con el numerador para el valor crítico Q a es I, 
el número de medias de la población o tratamiento que se están comparando y no I — 1 co¬ 
mo en la prueba F. Cuando las x¡., x¡. y CME se sustituyen en (10.4), el resultado es 
un conjunto de intervalos de confianza con nivel de confianza simultáneo de 100(1 — a)% 
para todas las diferencias de la forma p, — ¡ij con i < j. Cada intervalo que no incluye 0 
da lugar a la conclusión de que los valores correspondientes de p, y p / difieren significati¬ 
vamente uno de otro. 

Como en realidad no interesan los límites inferior y superior de los diversos interva¬ 
los sino sólo cuál incluye 0 y cuál no, mucha de la aritmética asociada con (10.4) puede ser 
evitada. El siguiente recuadro da detalles y describe cómo se pueden identificar las diferen¬ 
cias de modo visual con un “patrón de subrayado”. 

Método T para identificar p, significativamente diferentes 

S e selecci ona a, se extrae Q n ¡ , (J _,, de la tabla A.10 y se calcula w = Qdiu-i) ‘ 

VCME//. Luego se hace una lista de las medias muéstrales en orden creciente y se 
subrayan los pares que difieren menos de w. Cualquier media muestral no subrayada 
por la misma raya corresponde a un par de medias de población o tratamiento juzga¬ 
das significativamente diferentes. 


Supóngase, por ejemplo, que I = 5 y que 

x 2 . < x 5 . < x 4 . < x t . < x 3 . 

Entonces 

1. Considere en primer lugar la media más pequeña x 2 .. Si x 5 . — x 2 . > w, prosiga al paso 2. 
Sin embargo, si x 5 . — x 2 . < w, conecte estas primeras dos medias con un segmento de 
línea. Luego si es posible extienda este segmento de línea más a la derecha de la x¡. más 
grande que difiera de x 2 . en menos de w (de modo que la línea pueda conectar dos, tres 
o incluso más medias). 

2. Ahora siga con x 5 . y otra vez extienda el segmento de línea hasta la derecha de la x¡. más 
grande que difiera de i 5 . en menos de w (puede que sea posible trazar esta línea o alter¬ 
nativamente puede que subraye sólo dos medias o tres o incluso las cuatro medias res¬ 
tantes). 

3. Continúe con x 4 . y repita y finalmente continúe con a). 
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Ejemplo 10.4 


e 


Ejemplo 10.5 
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Para resumir, comenzando en cada media que aparece en la lista ordenada, un segmento de 
línea se extiende tan lejos a la derecha como sea posible en tanto que la diferencia entre las 
medias sea menor que w. Es fácil verificar que un intervalo particular de la forma (10.4) 
contendrá 0 si y sólo si el par correspondiente de medias muéstrales está subrayado por el 
mismo segmento de línea. 

Se realizó un experimento para comparar cinco marcas diferentes de filtros de aceite para 
automóviles con respecto a su capacidad de atrapar materia extraña. Sea ¡j,¡ la cantidad pro¬ 
medio verdadera de material atrapado por filtros marca i (i = 1,.. ., 5) en condiciones con¬ 
troladas. Se utilizó una muestra de nueve filtros de cada marca y se obtuvieron las siguientes 
cantidades medias muéstrales: x,. = 14.5, x 2 . = 13.8, x 3 . = 13.3, x 4 .= 14.3 y x 5 . = 13.1. La 
tabla 10.3 es una tabla ANOVA que resume la primera parte del análisis. 


Tabla 10.3 Tabla ANOVA para el ejemplo 10.4 


Origen de la variación 

Grados de 
libertad 

Suma de 

los cuadrados 

Cuadrado 
de la media 

/ 

Tratamientos (marcas) 

4 

13.32 

3.33 

37.84 

Error 

40 

3.53 

0.088 


Total 

44 

16.85 




Como E 005 4 40 = 2.61, H 0 es rechazada (decisivamente) a un nivel de 0.05. Ahora utilice el 
procedimiento de Tukey para buscar diferencias significativas entre las ¡jl¡. En la tabla A. 10 
del apéndice, Q 0 n3 34n = 4 .04 (el segundo subíndice de Q es I y no I — 1 como en F), por lo 
tanto w = 4.04Vo.088/9 = 0.4. Después de ordenar las cinco medias muéstrales en orden 
creciente, un segmento de línea puede conectar a las dos más pequeñas porque difieren por 
menos de 0.4. No obstante, este segmento no puede ser extendido más a la derecha puesto 
que 13.8 — 13.1 = 0.7 > 0.4. Moviéndose una media a la derecha, el par x 3 . y x 2 . no pue¬ 
de ser subrayado porque estas medias difieren por más de 0.4. De nuevo moviéndose a la 
derecha, la siguiente media, 13.8, no puede ser conectada a algo que esté más a la derecha. 
Las dos últimas medias pueden ser subrayadas con el mismo segmento de línea. 

x 5 . % x 2 . x 4 . X|. 

13.1 13.3 13~8 14.3 14.5 



Así pues las marcas 1 y 4 no son significativamente diferentes una de otra, pero sí son más 
altas de manera significativa que las otras tres marcas en sus contenidos promedio verdade¬ 
ros. La marca 2 es significativamente mejor que la 3 y 5 pero peor que la 1 y 4 y las marcas 
3 y 5 no difieren en modo significativo. 

Si x 2 . = 14.15 en lugar de 13.8 con el mismo valor w calculado, entonces la configu¬ 
ración de medias subrayadas sería 


x 5 . x 3 . 

13.1 13.3 


* 2 . 

14.15 


X 4 . x¡. 

14.3 14.5 ■ 


Un biólogo deseaba estudiar los efectos del etanol en el periodo de sueño. Se seleccionó una 
muestra de 20 ratas equiparadas por edad y otras características y a cada rata se le adminis¬ 
tró una inyección oral con una concentración particular de etanol por peso corporal. Luego 
se registró el periodo de sueño de movimiento rápido de ojos (REM, por sus siglas en in¬ 
glés) de cada rata durante 24 horas, con los siguientes resultados: 


























cl0_p369-396.gxd 3/12/08 4:23 AM Page 382 



382 CAPÍTULO 10 Análisis de la varianza 


Tratamiento (concentración de etanol) 

x ¿ . 

x¡. 

0 (control) 

88.6 

73.2 

91.4 

68.0 

75.2 

396.4 

79.28 

1 g/kg 

63.0 

53.9 

69.2 

50.1 

71.5 

307.7 

61.54 

2 g/kg 

44.9 

59.5 

40.2 

56.3 

38.7 

239.6 

47.92 

4 g/kg 

31.0 

39.6 

45.3 

25.2 

22.7 

163.8 

32.76 


x.. = 1107.5 je.. = 55.375 


¿Indican los datos que el periodo de sueño REM depende de la concentración de etanol? 
(Este ejemplo está basado en el experimento reportado en “Relationship of Ethanol Blood 
Level to REM and Non-REM Sleep Time and Distribution in the Rat”, Life Sciences, 1978: 
839-846.) 

Las x¡. difieren sustancialmente una de otra, aunque también existe una gran cantidad 
de variabilidad dentro de cada muestra, por lo que para responder la pregunta con precisión 
se debe realizar el ANOVA. Con 'Z'Zxj- = 68 697.6 y el factor de corrección xrj(lj) = 
(1107.5) 2 /20 = 61 327.8, las fórmulas dan 

STC = 68 697.6 - 61 327.8 = 7369.8 

STCr = -|[(396.40) 2 + (307.70) 2 + (239.60) 2 + (163.80) 2 ] - 61327.8 
= 67210.2 - 61327.8 = 5882.4 



y 


SCE = 7369.8 - 5882.4 = 1487.4 

La tabla 10.4 es una tabla ANOVA SAS. La última columna da el valor P como 0.0001. 
Con un nivel de significación de 0.05, se rechaza la hipótesis nula H 0 : /x, = ¡± 2 = ¡jl 4 = , 

puesto que valor P = 0.0001 < 0.05 = a. Parece que el periodo de sueño REM depende del 
nivel de concentración. 



Tabla 10.4 Tabla ANOVA obtenida con SAS 


Análisis de procedimientos de varianza 


Variable 

dependiente: 

Tiempo 






Suma de 

Cuadrado de 



Origen 

GL 

cuadrados 

la media 

Valor F 

Pr > F 

Modelo 

3 

5882.35750 

1960.78583 

21.09 

0.0001 

Error 

16 

1487.40000 

92.96250 



Corregido 

Total 

19 

7369.75750 





Existen 7=4 tratamiento s y 15 g rados de libertad asociados con el error, por lo tan¬ 
to Q 0 05416 = 4-05 y w = 4.05V93.0/5 = 17.47. Ordenando las medias y subrayándolas se 
obtiene 

X 4 . % X 2 . X|. 

32.76 47.92 61.54 79.28 


La interpretación de este subrayado debe hacerse con cuidado, puesto que parece que se ha 
concluido que los tratamientos 2 y 3 no difieren, 3 y 4 no difieren y no obstante 2 y 4 sí 
lo hacen. La forma sugerida de expresar esto es decir que aunque la evidencia permite con¬ 
cluir que los tratamientos 2 y 4 difieren uno de otro, no se ha demostrado que alguno es 
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significativamente diferente del 3. El tratamiento 1 tiene un periodo de sueño REM prome¬ 
dio verdadero más alto de manera significativa que cualquiera de los demás tratamientos. 

La figura 10.4 muestra resultados obtenidos con SAS a partir de la aplicación del pro¬ 
cedimiento de Tukey. 



Alfa=0.05 gl=16 CME=92.9625 
Valor crítico de rango estudentizado = 4.046 
Diferencia mínima significante = 17.446 

Medias con el mismo tipo no son significativamente diferentes. 


Agrupación Tukey 
A 


Media 

79.280 


N 

5 


Tratamiento 
0(control) 


61.540 

47.920 

32.760 


1 gm/kg 

2 gm/kg 
4 gm/kg 


Figura 10.4 Método de Tukey realizado con SAS. 


Interpretación de a en el método de Tukey 

Previamente se manifestó que el método de Tukey controla el intervalo de confianza simul¬ 
táneo. Entonces ¿qué significa “simultáneo” en este caso? Calcúlese un intervalo de con¬ 
fianza de 95% para una media de población p basada en una muestra de dicha población y 
luego un intervalo de confianza de 95% para una proporción de población p basado en otra 
muestra seleccionada independientemente de la primera. Antes de obtener los datos, la pro¬ 
babilidad de que el primer intervalo incluya p es de 0.95 y ésta también es la probabilidad 
de que el segundo intervalo incluya p. Como las dos muestras se seleccionan de manera 
independiente una de otra, la probabilidad de que ambos intervalos incluyan los valores de los 
parámetros respectivos es (0.95)(0.95) = (0.95) 2 ~ 0.90. Por consiguiente, el nivel de con¬ 
fianza simultáneo o conjunto para los dos intervalos es aproximadamente de 90%, si se 
calculan pares de intervalos una y otra vez con muestras independientes, a la larga aproxima¬ 
damente 90% de las veces el primer intervalo capturará p y el segundo incluirá p. Asimis¬ 
mo, si se calculan tres intervalos de confianza basados en muestras independientes, el nivel 
de confianza simultáneo será de 100(0.95) 3 % ~ 86%. Claramente, a medida que se incre¬ 
menta el número de intervalos, el nivel de confianza simultáneo de que todos los intervalos 
capturen sus respectivos parámetros se reducirá. 

Ahora supóngase que se desea mantener el nivel de confianza simultáneo en 95%. En¬ 
tonces para dos mues tras i ndependientes, el nivel de confianza individual para cada una ten¬ 
dría que ser de 100V0.95% ~ 97.5%. Mientras más grande es el número de intervalos, más 
alto tendría que ser el nivel de confianza individual para mantener el nivel simultáneo en 95%. 

El truco en relación con los intervalos Tukey es que no están basados en muestras inde¬ 
pendientes, CME aparece en todos y varios intervalos comparten las mismas x¡_ (p. ej., en el 
caso 1 = 4, tres intervalos diferentes utilizan x h ). Esto implica que no existe un argumento de 
probabilidad directo para discernir el intervalo de confianza simultáneo de los niveles de con¬ 
fianza individuales. No obstante, se puede demostrar que si se utiliza Q 005 , el nivel de confian¬ 
za simultáneo se controla a 95%, en tanto que si se utiliza <2 001 se obtiene un nivel simultáneo 
de 99%. Para obtener un nivel simultáneo de 95%, el nivel individual de cada intervalo debe 
ser considerablemente más grande que 95%. Expresado en una forma un poco diferente, para 
obtener una proporción de error de 5% asociada con un experimento o familia, la proporción 
de error por comparación o individual para cada intervalo debe ser considerablemente más pe¬ 
queña que 0.05. MINITAB le pide al usuario que especifique la proporción de error asociado 
con la familia (p. ej., 5%) y luego incluye en los datos de salida la proporción de error indivi¬ 
dual (véase el ejercicio 16). 
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Intervalos de confianza para 
otras funciones paramétricas 


Ejemplo 10.6 

(continuación 
del ejemplo 
10.4) 


En algunas situaciones, se desea un intervalo de confianza para una función de las i± t más 
complicada que una diferencia p, — ¡r¡. Sea 9 = T.cm¡, donde las c son constantes. Una fun- 
ción como esa es yl/i, + p 2 ) — j(p 3 + p 4 + p 5 ), la cual en el contexto del ejemplo 10.4 
mide la diferencia entre el grupo compuesto de las dos primeras marcas y la de las últimas 
tres. Como las X- están normalmente distribuidas con E(X¡j) = ¡jl ¡ y V(X¡j) = cr 2 , 9 = Y,,c,X t , 
está normalmente distribuida, insesgada para 9, y 


V(0) = V(lc,X„) = lc 2 V(X,) = 

i i J i 

La estimación de cr 2 mediante CME y la formación de cr 0 da por resultado una variable t 
(9 — 9)/(},), la cual puede ser manipulada para obtener el siguiente intervalo de confianza de 
100(1 — a)% paraje,p ; : 


Hc¡x, ± t 


a/2,I(J—\) 


CMEÜc? 


(10.5) 


La función paramétrica para comparar las primeras dos marcas de filtro de aceite (tienda) 
con las últimas tres marcas (nacionales) es 6 = + p 2 ) — 1(^3 + P 4 + p 5 ), con la cual 



Con 9 = j(x h + x 2 .) — |(x 3 . + x 4 . + x 5 .) = 0.583 y CME = 0.088, un intervalo de 
95% es 


0.583 ± 2.021 V5(0.088)/[(6)(9)] = 0.583 ± 0.182 = (0.401, 0.765) ■ 


En ocasiones se realiza un experimento para comparar cada uno de varios tratamien¬ 
tos “nuevos” con un tratamiento de control. En tales situaciones, una técnica de compara¬ 
ciones múltiples llamada método de Dunnett es apropiada. 


EJERCICIOS Sección 10.2 (11-21) 


11 . En un experimento para comparar las proporciones de co¬ 
bertura de cinco marcas diferentes de pintura amarilla de lá¬ 
tex para interiores disponibles en un área particular se 
utilizaron 4 galones (7 = 4) de cada pintura. Las proporcio¬ 
nes de cobertura promedio verdaderas (pies 2 /gal) de las 
cinco marcas fueron x¡. = 462.0, x 2 . = 512.8, x¡. = 437.5, 
x 4 . = 469.3 y x 5 . = 532.1. Se encontró que el valor calcu¬ 
lado de F es significativo a un nivel de a = 0.05. Con CME 
= 272.8 use el procedimiento de Tukey para investigar di¬ 
ferencias significativas en las proporciones de cobertura 
promedio verdaderas entre marcas. 

12 . En el ejercicio 11 suponga x 3 . = 427.5. Ahora, ¿cuáles pro¬ 
porciones de cobertura promedio verdaderas difieren signi¬ 
ficativamente una de otra? Asegúrese de utilizar el método 
de subrayar para ilustrar sus conclusiones y escriba un pá¬ 
rrafo que resuma sus resultados. 

13 . Repita el ejercicio 12 suponiendo que x,. = 502.8 además 
de * 3 . = 427.5. 

14 . Use el procedimiento de Tukey con los datos del ejercicio 4 
para identificar diferencias en los tiempos de vuelo prome¬ 
dio verdaderos entre los cuatro tipos de mosquitos. 


15 . Use el procedimiento de Tukey con los datos del ejerci¬ 
cio 6 para identificar diferencias en el Fe total promedio 
verdadero entre los cuatro tipos de formaciones (use 
CME = 15.64). 

16 . Reconsidere los datos de rigidez axial dados en el ejercicio 8. 
Los siguientes son datos ANOVA obtenidos con MINITAB. 


Análisis 

de 

varianza 

para rigide 

Longitud 

GL 

SC 

CM 

de origen 

4 

43993 

10998 

Error 

30 

31475 

1049 

Total 

34 

75468 


Nivel 

N 

Media 

DesvEst 

4 

7 

333.21 

36.59 

6 

7 

368.06 

28.57 

8 

7 

375.13 

20.83 

10 

7 

407.36 

44.51 

12 

7 

437.17 

26.00 


DesvEst agrupada = 32.39 
Comparaciones por pares de Tukey 

Tasa de error grupal = 0.0500 
Tasa de error individual = 0.00693 
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Valor crítico = 4.10 

Intervalos para (media de nivel de columna) 


(media 

de nivel de 

fila) 




4 

6 

8 

10 

6 

O 

LO 

CO 

1 





15.4 




8 

-92.1 

-57.3 




8.3 

43.1 



10 

-124.3 

-89.5 

-82.4 



-23.9 

10.9 

18.0 


12 

-154.2 

-119.3 

-112.2 

-80. 


-53.8 

1 

I— 4 

00 

uo 

-11.8 

20 . 


a. ¿Es factible que las varianzas de las cinco distribuciones 
de rigidez axial sean idénticas? Explique. 

b. Use los resultados (sin referencia a la tabla F) para pro¬ 
bar las hipótesis pertinentes. 

c. Use los intervalos de Tukey dados en los resultados pa¬ 
ra determinar cuáles medias difieren y construya el patrón 
de subrayado correspondiente. 

17 . Remítase al ejercicio 5. Calcule un intervalo de confianza t 

de 95% con 6 = + p, 2 ) — AU- 

18 . Considere los datos adjuntos sobre crecimiento de plantas 
después de la aplicación de diferentes tipos de la hormona del 
crecimiento. 


7 13 17 7 14 

2 21 13 20 17 

Hormona 3 18 15 20 17 

4 7 11 18 10 

5 6 11 15 8 


a. Realice una prueba F al nivel a = 0.05. 

b. ¿Qué sucede cuando se aplica el procedimiento de Tukey? 

19 . Considere una experimento ANOVA unifactorial en el cual 

I = 3, J = 5, x h = 10, x 2 . = 12 y T 3 . = 20. Encuentre un 
valor de SCE con el cual / > F 0052 l2 de modo que H 0 : 
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Fi — AU = AL sea rechazada, aunque cuando se aplica el 
procedimiento de Tukey se puede decir que ninguna de las 
¿q difieren significativamente una de otra. 

20 . Remítase al ejercicio 19 y suponga x¡. = 10, x 2 . = 15 y 
í 3 . = 20. ¿Puede hallar ahora un valor de SCE que produz¬ 
ca semejante contradicción entre la prueba F y el procedi¬ 
miento de Tukey? 

21 . El artículo “The Effect of Enzyme Inducing Agents on the 
Survival Times of Rats Exposed to Lethal Levels of Nitrogen 
Dioxide” {Toxicology and Applied Pharmacology, 1978: 169- 
174) reporta los siguientes datos sobre tiempos de sobreviven¬ 
cia de ratas expuestas a bióxido de nitrógeno (70 ppm) vía 
diferentes regímenes de inyección. Hubo J = 14 ratas en ca¬ 
da grupo. 



Régimen 

x ; .(min) 

s¿ 

1. 

Control 

166 

32 

2. 

3-Metilcolan treno 

303 

53 

3. 

Alilisopropilacetamida 

266 

54 

4. 

Fenobarbital 

212 

35 

5. 

Clorpromacina 

202 

34 

6. 

Acido p-Aminobenzoico 

184 

31 


a. Pruebe las hipótesis nulas de que el tiempo de sobrevi¬ 
vencia promedio verdadero no depende del régimen de 
inyección contra la alternativa de que existe alguna de¬ 
pendencia en el régimen de inyección con a = 0.01. 

b. Suponga que se calculan intervalos de confianza de 
100(1 — a)% para k funciones paramétricas diferentes 
con el mismo conjunto de datos ANOVA. Entonces es fá¬ 
cil verificar que el nivel de confianza simultáneo es por 
lo menos de 100(1 — kot)°7c. Calcule intervalos de con¬ 
fianza con nivel de confianza simultáneo por lo menos 
de 98% para — \(fx 2 + ¿t 3 + p 4 + p 5 + p 6 ) y 
HaU + AU + AU + AU) “ Ahí- 



| 10.3 Más sobre ANOVA unifactorial 

A continuación se considera con brevedad algunos temas adicionales relacionados con 
ANOVA unifactorial. Éstos incluyen una descripción alternativa de los parámetros modelo, 
¡3 para la prueba F, la relación de la prueba con los procedimientos previamente considera¬ 
dos, la transformación de datos, un modelo de efectos aleatorios y las fórmulas para el caso 
de tamaños de muestra desiguales. 


El modelo ANOVA 

Las suposiciones de ANOVA unifactorial pueden ser descritas sucintamente por medio de 
la “ecuación modelo” 


Xa = p, + 


donde e¡- representa una desviación aleatoria de la población o de la media de tratamiento ver¬ 
dadera fij. Se supone que las e- son variables aleatorias independientes normalmente distri¬ 
buidas (lo que implica que las X- también lo son) con E(e¡p = 0 [de modo que E(X¡) = /x f J 
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y V(e¡j) = cr 2 [de donde V(X :J ) = a 2 para todas las i y /]. Una descripción alternativa de 
ANOVA unifactorial dará una idea adicional y sugerirá generalizaciones apropiadas de mo¬ 
delos que implican más de un factor. Defínase el parámetro p como 

1 y 

M = 7 L Vi 

l i= 1 



y los parámetros . . . , a 7 como 

a ¡ = jLi f - p (i = 1, . . ., /) 

Entonces la media del tratamiento p, se escribe como p + cq, donde p representa la respues¬ 
ta total promedio verdadera en el experimento y a¡ es el efecto, medido como un alejamiento 
de p, debido al í-ésimo tratamiento. Mientras que inicialmente se tenían parámetros I, ahora 
se tienen parámetros I + 1 (p, a u . . ., a¡). Sin embargo, como Jp, = 0 (el alejamiento pro¬ 
medio de la respuesta media total es cero) sólo si I de estos parámetros están determinados de 
manera independiente, así que existen muchos parámetros independientes como los hubo an¬ 
tes. En función de p y las a¡, el modelo se vuelve 

Xy = p + a¡ + € v (i = 1, . . . , I, j = 1, . . . , J) 

En el capítulo 11, se desarrollarán modelos análogos para ANOVA multifactorial. La afir¬ 
mación de que las p, son idénticas es equivalente a la igualdad de las a¡ y como Jp, = 0, 
la hipótesis nula se vuelve 

H 0 - «i = oí 2 = ■ ■ ■ = a¡ = 0 

En la sección 10.1, se manifestó que CMTr es un estimador insesgado de cr 2 cuando 
H 0 es verdadera aunque de lo contrario tiende a sobrestimar cr 2 . Más precisamente, 


E(CMTr) = cr 2 + y^yZa 2 


Cuando H 0 es verdadera, 2j« 2 = 0 o £(CMTr) = cr 2 (CME es insesgada sea H 0 o no verda¬ 
dera). Si Jp 2 se utiliza como medida del grado al cual H 0 es falsa, entonces un valor más 
grande de Jp 2 provocará una mayor tendencia de que CMTr sobrestime cr 2 . En el siguiente 
capítulo, se utilizarán fórmulas para cuadrados de las medias esperadas en modelos multi- 
factoriales a fin de sugerir cómo formar proporciones F para probar varias hipótesis. 

Comprobación de la fórmula para f(CMTr) Con cualquier variable aleatoria, Y, E(Y 2 ) = 
V(Y) + [E{Y)] 2 , por lo tanto 

E(STCr) = E(jXA 2 - jjXi'j = j^E(X 2 ) - jjE(X 2 .) 

= ylíWX,.) + [E(X.)] 2 \ - ~j\V(X..) + [£(* )] 2 } 

= - jjUJ(T 2 + (//p) 2 ] 

= la 2 + Z/p 2 + 2 piX a ; + cr 2 /Jp 2 

i i 

= (/ — I )cr 2 + J Xa 2 (puesto que ^a, = 0) 


El resultado se deriva entonces de la relación CMTr = STCr/(7 — 1). 
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j8 para la prueba F 

Considérese un conjunto de valores de parámetro aq, a„ ,,,, a¡ con los cuales H 0 no es ver¬ 
dadera. La probabilidad de un error de tipo II, /3, es la probabilidad de que H 0 no sea recha¬ 
zada cuando ese conjunto es el conjunto de valores verdaderos. Se podría pensar que ¡3 
tendría que ser determinada por separado por cada configuración diferente de a¡. Afortuna¬ 
damente, como /3 para la prueba F depende de las a¡ y cr 2 sólo mediante ^oq/rr 2 , se puede 
evaluar al mismo tiempo para muchas alternativas diferentes. Por ejemplo, YjOí] = 4 para 
cada uno de los siguientes conjuntos de a¡ con los cuales H 0 es falsa, así que j8 es idéntica 
para las tres alternativas: 

1. aq = -1, a 2 = -1, aq = 1, a 4 = 1 

2. aq = —' \Í2, a 2 = V2, a 3 = 0, a 4 = 0 

3. aq = -V3, a 2 = Vl/3, a 3 = Vl/3, a 4 = Vl/3 

La cantidad J'Zot 2 ¡/a 2 se llama parámetro de no centralidad para ANOVA unidirec¬ 
cional (debido a que F/ 0 es falsa el estadístico de prueba tiene una distribución F no centra¬ 
lizada con éste como uno de sus parámetros) y /3 es una función decreciente del valor de 
este parámetro. Por lo tanto, con valores fijos de a 2 y J, es más probable que la hipótesis nu¬ 
la sea rechazada para alternativas alejadas de H 0 Va 2 grande) que para alternativas próxi¬ 
mas a H 0 . Con un valor fijo de ’Za 2 , ¡3 se reduce a medida que el tamaño de muestra J en 
cada tratamiento se incrementa y aumenta a medida que la varianza cr se incrementa (pues¬ 
to que una variabilidad subyacente más grande dificulta detectar cualquier alejamiento dado 
con respecto a H 0 ). 

Como el cálculo a mano de ¡3 y la determinación del tamaño de muestra para la prue¬ 
ba F son bastante difíciles (como en el caso de pruebas t), los estadísticos han construido 
conjuntos de curvas donde se puede obtener ¡3. En las figuras 10.5* y 10.6* se muestran con¬ 
juntos de curvas para rq = 3 y rq = 4 grados de libertad asociados con el numerador, res¬ 
pectivamente. Una vez que se especifican los valores de cr 2 y las cr, para los cuales se desea 
[3, éstos se utilizan para calcular el valor de </>, donde 4> 2 = {J/IÍZaj/cr 2 . Luego se localiza 
el valor 4> en conjunto de curvas apropiado sobre el eje horizontal, se sube hasta la 



12 3 (f >(con a = 0.05) 

(¡>(cona = 0.01)— 1 2 3 4 5 

Figura 10.5 Curvas de potencia para la prueba F ANOVA (iq = 3). 


Tomada de E. S. Pearson y H. O. Hartley “Charts of the Power Function for Analysis of Variance Tests, Derived 
from the Non-Central F Distribution”, Biometrika, vol. 38, 1951: 112, con el permiso de Biometrika Trustees. 
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1 2 3 -*—</> (con a = 0.05) 

4>(cona = 0.01) — 1 2 3 4 5 

Figura 10.6 Curvas de potencia para la prueba FANOVA (iq = 4). 


curva asociada con los v 2 grados de libertad asociados con el error y se localiza el valor de 
la potencia sobre el eje vertical. Finalmente, ¡3 = 1 — potencia. 

Ejemplo 10.7 Se tienen que investigar los efectos de cuatro tratamientos térmicos diferentes en el punto 
de cedencia (tons/pulg 2 ) de lingotes de acero. Un total de ocho lingotes se fundirán utilizan¬ 
do cada tratamiento. Suponga que la desviación estándar verdadera del punto de cedencia 
con cualquiera de los cuatro tratamientos es cr = 1. ¿Qué tan probable es que H 0 no será re¬ 
chazada a un nivel de 0.05 si tres de los tratamientos tienen el mismo punto de cedencia es¬ 
perado y el otro tiene un punto de cedencia esperado que es 1 ton/pulg 2 más grande que el 
valor común de los otros tres (es decir, la cuarta cedencia está en promedio a 1 desviación 
estándar por encima de aquellas con los primeros tres tratamientos)? 

Suponga que /u, = ¡jl 2 = /a 3 y /u 4 = + 1, ¿u, = (EjuQ/ú = /x, + Entonces oq = 

Mi - JU, = «2 = «3 = a 4 = T por lo tanto 



y <t> = 1.22. Los grados de libertad son v l = I — 1 = 3 y v 2 = I(J — 1) = 28, si se interpo¬ 
la visualmente entre v 2 = 20 y v 2 = 30 se obtiene una potencia ~ 0.47 y /3 ~ 0.53. Esta ¡3 
es algo grande, así que se podría incrementar el valor de J. ¿Cuántos lingotes de cada tipo 
se requerirían para dar /3 ~ 0.05 para la alternativa considerada? Probando diferentes valo¬ 
res de J, se puede verificar que J = 24 satisfará el requerimiento, pero cualquier J más pe¬ 
queño no lo hará. ■ 

Como una alternativa del uso de curvas de potencia, el programa estadístico SAS in¬ 
cluye una función que calcula el área acumulada bajo una curva F no centralizada (se ingre¬ 
sa F a , grados de libertad asociados con el numerador, grados de libertad asociados con el 
denominador y </> 2 ) y esta área es ¡3. La versión 14 de MINITAB hace esto y también algo 
un tanto diferente. Se le pide al usuario que especifique la diferencia máxima entre las ¿q y 
no entre las medias individuales. Por ejemplo, se podría desear calcular la potencia de la prue¬ 
ba cuando I = 4, ¡jl 1 = 100, ¡± 2 = 101, p. , = 102 y /x 4 = 106. Entonces la diferencia máxima 
es 106 — 100 = 6. Sin embargo, la potencia no sólo depende de esta diferencia máxima sino 
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Ejemplo 10.8 
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de los valores de todas las /jl¡ . En esta situación MINITAB calcula el valor de potencia más 
pequeño posible sujeto a ¡l 1 = 100 y /i 4 = 106, lo cual ocurre cuando las otras dos fi¡ se en¬ 
cuentran a la mitad entre 100 y 106. Si esta potencia es de 0.85, entonces se puede decir que 
la potencia es de por lo menos 0.85 y /3 es cuando mucho de 0.15 cuando las dos ¡jl están se¬ 
paradas por 6 (el tamaño de muestra común, aya también deben ser especificados). El pro¬ 
grama determinará también el tamaño de muestra común si la diferencia máxima y la 
potencia mínima están especificadas. 

Relación de la prueba F con la prueba t 

Cuando el número de tratamientos o poblaciones es I = 2, todas las fórmulas y resultados 
conectados con la prueba F siguen teniendo sentido, así que se puede utilizar ANOVA para 
probar H 0 : /r¡ = ¡± 2 contra H á : /j., A /jl 2 . En este caso, también se puede utilizar una prueba 
t con dos muestras de dos colas. En la sección 9.3, se mencionó la prueba t agrupada, la cual 
requiere varianzas iguales, como alternativa del procedimiento t con dos muestras. Se pue¬ 
de demostrar que la prueba F ANOVA unifactorial y la prueba t agrupada de dos colas son 
equivalentes; con cualquier conjunto de datos dado, los valores P para las dos pruebas se¬ 
rán idénticos, así que se llegará a la misma conclusión con cualquier prueba. 

La prueba t con dos muestras es más flexible que la prueba F cuando 1 = 2 por dos ra¬ 
zones. En primer lugar, es válida sin la suposición de que a¡ = a 2 ; en segundo lugar, puede 
ser utilizada para probar // a : /jl 1 > /x 2 (una prueba t de cola superior) o H a = ¡jl 1 < ¡i 2 así co¬ 
mo también H a : ¡± ] A ¡x 2 . En el caso de I > 3, desafortunadamente no existe un procedimien¬ 
to de prueba general que tenga buenas propiedades sin la suposición de varianzas iguales. 

Tamaños de muestra desiguales 

Cuando los tamaños de muestra de cada población o tratamiento no son iguales, sean J { , 
J 2 ,... los I tamaños de muestra y sea n = 2,/, el número total de observaciones. El re¬ 
cuadro adjunto da fórmulas ANOVA y el procedimiento de prueba. 



STC = Z ¿ (X,j ~ X..) 2 = I ¿ X 2 — -X 2 . 
i= 1 j= 1 i=l j= 1 n 

STCr = Z ¿ (X, ~ X.) 2 = 2 --X 2 - -X}„ 
1=17=i i= i J i n 

i Ji 

SCE (V - X¡) 2 = STC - STCr 

;=i /=i 


gl = n ~ 1 
gl = / - 1 

gl = !(/, -\) = n-I 


Valor estadístico de prueba: 


CMTr 

CME 


donde CMTr = 


STCr 
/- 1 


CME 


SCE 
n — 1 


Región de rechazo: / > F a ¡_, n _¡ 


El artículo “On the Development of a New Approach for the Determination of Yield 
Strength in Mg-based Alloys” (Light Metal Age, octubre de 1998: 51-53) presentó los si¬ 
guientes datos sobre módulo elástico (GPa) obtenidos por medio de un nuevo método ultra¬ 
sónico con especímenes de cierta aleación producida mediante tres procesos de fundición 
diferentes. 
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Jt 

*;■ 

x i- 

Moldeado permanente 

45.5 

45.3 

45.4 

44.4 

44.6 

43.9 

44.6 

44.0 

8 

357.7 

44.71 

Fundición a troquel 

44.2 

43.9 

44.7 

44.2 

44.0 

43.8 

44.6 

43.1 

8 

352.5 

44.06 

Moldeado en yeso 

46.0 

45.9 

44.8 

46.2 

45.1 

45.5 



6 

273.5 

45.58 










22 

983.7 




Sean p v p 2 y ju, 3 los módulos elásticos promedio verdaderos con los tres procesos diferen¬ 
tes en las circunstancias dadas. Las hipótesis pertinentes son H 0 : /si , = p 2 = p 3 contra H d : 
por lo menos dos de las p¡ son diferentes. El estadístico de prueba es, desde luego, 
F = CMTr/CME, basado en I — 1 =2 grados de libertad asociados con el numerador y 
n — I = 22 — 3 = 19 grados de libertad asociados con el denominador. Las cantidades per¬ 
tinentes incluyen 

QO') 72 

5X4 = 43 998.73 CF = = 43 984.80 

STC = 43 998.73 - 43 984.80 = 13.93 
357 7 2 352 5 2 273 5 2 

STCr = + + - 43 984.80 = 7.93 

8 8 6 

SCE = 13.93 - 7.93 = 6.00 

Los cálculos restantes se muestran en la tabla ANOVA adjunta. Como ^0001219 = 10.16 
< 12.56 = /, el valor P es más pequeño que 0.001. Por consiguiente, la hipótesis nula de¬ 
berá ser rechazada a cualquier nivel de significación razonable; existe evidencia convincen¬ 
te para concluir que el módulo elástico promedio verdadero en cierta forma depende de qué 
proceso de fundición se utilice. 


Origen de la variación 

Grados de 
libertad 

Suma de 
los cuadrados 

Cuadrado 
de la media 

/ 

Tratamientos 

2 

7.93 

3.965 

12.56 

Error 

19 

6.00 

0.3158 


Total 

21 

13.93 





Existe más controversia entre estadísticos con respecto a qué procedimiento de comparacio¬ 
nes múltiples utilizar cuando los tamaños de muestra son desiguales que los que existen en 
el caso de tamaños de muestra iguales. El procedimiento que aquí se presenta lo recomien¬ 
da el excelente libro Beyond ANOVA: Basics of Applied Statistics (véase la bibliografía del 
capítulo) para usarse cuando los I tamaños de muestra /,, J 2 , . . . , J, están razonablemente 
cerca uno de otro (“desequilibrio leve”). Modifica el método de Tukey por medio de promedios 
de pares I IJ¡ s en lugar de l/J. 


Sea 







1 CME 

1 

1 \ 
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10.3 Más sobre ANOVA unifactorial 391 

El nivel de confianza simultáneo de 100(1 — a)% es sólo aproximado y no exacto ya que 
se determinó con tamaños de muestra iguales. El método de subrayado puede seguir siendo 
utilizado, pero ahora el factor w¡j utilizado para decidir si x¡. y x¡ pueden ser conectadas de¬ 
penderá de J¡ y Jj. 

Ejemplo 10.9 Los tamaños de muestra para los datos de módulo elástico fueron J [ = 8, J 2 = 8, / 3 = 6 

(continuación e / = 3, n — 7 = 19, CME = 0.316. Un nivel de confianza de 95% simultáneo requiere 

del ejemplo <2 0 05 3 19 = 3.59, de donde 
10 . 8 ) ' ” - 

"12 = 3-59 V^({ + 1) = 0-713, vv 13 = 0.771 w 23 = 0.771 

Como Xj. — x 2 . = 44.71 — 44.06 = 0.65 < w l2 , /-x, y /x 2 se consideran no significativamen¬ 
te diferentes. El esquema de subrayado adjunto muestra que en apariencia /i¡ y /x, difieren 
de manera significativa, como lo hacen /x 2 y /x,. 

2. A troquel 1. Permanente 3. Yeso 
44.06 44.71 45.58 ■ 



Transformación de datos 

El uso de métodos ANOVA puede ser invalidado por diferencias sustanciales en las varian- 
zas cr j, . . . , cr] (las que hasta ahora han sido supuestas iguales con valor común de er 2 ). En 
ocasiones sucede que V(X-) = cr] = g(¡x¡), una función conocida de ¡±¡ (de modo que cuando 
H 0 es falsa, las varianzas no son iguales). Por ejemplo, si X¡- tiene una distribución de Poisson 
con parámetro A ; (aproximadamente normal si \¡ > 10), entonces ¡jl¡ = A ( y <x 2 = A ; , de modo 
que g(fi¡) = ji¡ es la función conocida. En tales casos, a menudo se pueden transformar las 
X¡j en h{X¡j) de modo que tengan varianzas iguales de manera aproximada (al mismo tiem¬ 
po que las variables transformadas permanecen aproximadamente normales) y luego se pue¬ 
de utilizar la prueba F con las observaciones transformadas. La idea clave al seleccionar una 
transformación h(-) es que con frecuencia V[h(X¡j)] ~ V(X¡j) • [h'(fjL¡)] 2 = g(/x,) • [/z'(/u ; )] 2 . 
Se desea determinar la función h(-) con la cual g(/x ; ) • [/¡'(/x,)] 2 = c (una constante) con 
cada i. 



PROPOSICIÓN 


Si V(X¡j) = g(gi¡), una función conocida de /x ; , entonces una transformación de h(X¡j) 
que “estabilice la varianza” de modo que V[h(X¡j)] sea aproximadamente la misma 
con cada i está dada por h(x) / [g(x)] _1/2 dx. 


En el caso Poisson, g(x) = x, de modo que h(x) deberá ser proporcional a f x 1/2 dx = 
2x m . Así pues los datos Poisson deberán ser cambiados a h(x¡j) = antes del análisis. 


Un modelo de efectos aleatorios 

Se ha supuesto que los problemas unifactoriales considerados hasta ahora son ejemplos de 
un modelo ANOVA de efectos fijos. Con esto se quiere decir que los niveles elegidos del 
factor en estudio son los únicos considerados pertinentes por el experimentador. El modelo 
de efectos fijos unifactorial es 


X;¡ = ix+ a¡ + e.. 


= o 


( 10 . 6 ) 
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donde las e, ; son aleatorias y tanto ¡i como las a¡ son parámetros fijos cuyos valores son 
desconocidos. 

En algunos problemas unifactoriales, los niveles particulares estudiados por el expe¬ 
rimentador se seleccionan, mediante diseño o mediante muetreo, de una gran población 
de niveles. Por ejemplo, para estudiar los efectos en tiempo de desempeño de una tarea por 
la utilización de diferentes operarios en una máquina particular, se podría seleccionar una 
muestra de cinco operarios de un gran conjunto de operarios. Asimismo, se podría estudiar 
el efecto del pH del suelo en la cosecha de plantas de maíz utilizando suelos con cuatro va¬ 
lores de pH específicos seleccionados de entre los muchos niveles de pH posibles. Cuando 
los niveles utilizados se seleccionan al azar de entre una gran población de niveles posibles, 
se dice que el factor es aleatorio y no fijo, y el modelo de efectos fijos (10.6) ya no es apro¬ 
piado. Un modelo de efectos aleatorios se obtiene reemplazando las ct¡ fijas en (10.6) por 
variables aleatorias. La descripción del modelo resultante es 


X¡J = p + A¡ + €¡j con E(A¡) = E(e¡¡) = 0 
V(e tj ) = a 2 V(A,-) = cr 2 

todas las A¡ y e¡¡ normalmente distribuidas e independientes una de otra. 


(10.7) 



La condición E(A¡) = 0 en (10.7) es similar a la condición Y.a, = 0 en (10.6); manifiesta 
que el efecto esperado o promedio del í-ésimo nivel medido como un alejamiento de ¡± es cero. 

Para el modelo de efectos aleatorios (10.7), la hipótesis de ningunos efectos debido a 
los diferentes niveles es H 0 : cr \ = 0, la cual expresa que los diferentes niveles del factor con¬ 
tribuyen con nada a la variabilidad de la respuesta. Aunque las hipótesis en los modelos de 
efectos fijos unifactoriales y aleatorios son diferen tes, se prueban en exactamente la misma 
manera, formando F = CMTr/CME y rechazando H 0 , si /> F aI _ ln _¡. Esto se justifica de 
manera intuitiva al observar que Zs(CME) = a 2 (como para efectos fijos), mientras que 

£(CMTr) = o- 2 + JZTj~( n - ^a (10-8) 

donde J¡, J 2 , ... ,J¡ son los tamaños de muestra y n = YjJ,- El factor entre paréntesis en el 
lado derecho de (10.8) es no negativo, de modo que de nuevo £(CMTr) = cr 2 si H 0 es ver¬ 
dadera y £(CMTr) > o 2 si H 0 es falsa. 

Ejemplo 10.10 El estudio de fuerzas y esfuerzos no destructivos en materiales aporta información impor¬ 
tante para el diseño de ingeniería eficiente. El artículo “Zero-Force Travel-Time Parameters 
for Ultrasonic Head-Waves in Railroad Rail” ( Materials Evaluation, 1985: 854-858) repor¬ 
ta sobre un estudio de tiempo de recorrido de cierto tipo de onda que produce el esfuerzo 
longitudinal de rieles utilizados en vías de ferrocarril. Se realizaron tres mediciones en ca¬ 
da uno de seis rieles seleccionados al azar de una población de rieles. Los investigadores uti¬ 
lizaron ANOVA de efectos aleatorios para decidir si algo de la variación del tiempo de 
recorrido podía ser atribuido a la “variabilidad entre rieles”. Los datos se dan en la tabla 
adjunta (cada valor, en nanosegundos, se obtuvo de restar 36.1 p de la observación original) 
junto con la tabla ANOVA derivada. El valor de la proporción F es altamente significativo, 
así que H 0 : cr\ = 0 es rechazada a favor de que la conclusión de que las diferencias entre 
rieles provocan la variabilidad del tiempo de recorrido. 
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1: 

55 

53 

54 

x¡. 

162 

2: 

26 

37 

32 

95 

3: 

78 

91 

85 

254 

4: 

92 

100 

96 

288 

5: 

49 

51 

50 

150 

6: 

80 

85 

83 

248 




X ,. = 

1197 


Origen de 
la variación 

Grados de 
libertad 

Suma de 
los cuadrados 

Cuadrado de 
la media 

/ 

Tratamientos 

5 

9310.5 

1862.1 

115.2 

Error 

12 

194.0 

16.17 


Total 

17 

9504.5 




EJERCICIOS Sección 10.3 (22-34) 


22. Los datos siguientes se refieren a la cosecha de tomates 
(kg/parcela) con cuatro niveles de salinidad diferentes; el 
nivel de salinidad aquí se refiere a la conductividad eléctri¬ 
ca (CE), donde los niveles seleccionados fueron CE = 1.6, 
3.8, 6.0 y 10.2 nmhos/cm: 


1.6 

59.5 

53.3 

56.8 

63.1 

58.7 

3.8 

55.2 

59.1 

52.8 

54.5 


6.0 

51.7 

48.8 

53.9 

49.0 


10.2 

44.6 

48.5 

41.0 

47.3 

46.1 


Use la prueba F al nivel a = 0.05 para probar en cuanto a 
cualquier diferencia en la cosecha promedio verdadera de¬ 
bido a los distintos niveles de salinidad. 

23 . Aplique el método de Tukey modificado a los datos del ejer¬ 
cicio 22 para identificar diferencias significativas entre las /j.¡. 

24 . La siguiente tabla ANOVA parcial se tomó del artículo 
“Perception of Spatial Incongruity” ( J. Nervous and Mental 
Disease, 1961: 222) en el cual se evaluaron y compararon 
las habilidades de tres grupos diferentes de identificar una 
incongruencia perceptiva. Todos los individuos que partici¬ 
paron en el experimento habían estado hospitalizados para 
recibir un tratamiento psiquiátrico. Hubo 21 individuos en 
el grupo depresivo, 32 en el “otro” grupo funcional y 21 en el 
grupo de daño cerebral. Complete la tabla ANOVA y reali¬ 
ce una prueba F al nivel a = 0.01. 

Grados de Suma de Cuadrado de 
Origen libertad los cuadrados la media / 

Grupos 76.09 

Error 

Total 1123.14 


25. Los lípidos aportan mucha de la energía dietética en los 
cuerpos de bebés y niños. Existe un interés creciente en la 
calidad del suministro de lípido dietético durante la infan¬ 
cia como un importante determinante del crecimiento, desa¬ 
rrollo visual y nervioso y salud a largo plazo. El artículo 
“Essential Fat Requirements of Preterm Infants” ( Amer. J. 
ofClinical Nutrition , 2000: 245S-250S) reportó los siguien¬ 
tes datos sobre grasas polinsaturadas (%) para bebés que 
fueron asignados al azar a cuatro regímenes de alimenta¬ 
ción diferentes: leche materna, fórmula basada en aceite de 
maíz (AM), fórmula basada en aceite de soya (AS) o fórmu¬ 
la basada en aceite de soya y marino (ASM). 


Régimen 

Tamaño de 

muestra 

Media 

muestral 

Desv. estándar 
muestral 

Leche materna 

8 

43.0 

1.5 

AM 

13 

42.4 

1.3 

AS 

17 

43.1 

1.2 

ASM 

14 

43.5 

1.2 


a. ¿Qué suposiciones se deben hacer sobre las cuatro dis¬ 
tribuciones de grasa polinsaturada antes de realizar un 
ANOVA unifactorial para decidir si existen diferencias 
en el contenido de grasa promedio verdadero? 

b. Realice la prueba sugerida en el inciso a). ¿Qué se pue¬ 
de decir sobre el valor P? 

26 . Se analizaron muestras de seis marcas diferentes de marga¬ 
rina dietética/imitación para determinar el nivel de ácidos 
grasos polinsaturados fisiológicamente activos (PARFUA, 
por sus siglas en inglés, en porcentajes) y se obtuvieron los 
siguientes resultados: 
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Imperial 

14.1 

13.6 

14.4 

14.3 


Parkay 

12.8 

12.5 

13.4 

13.0 

12.3 

Blue Bonnet 

13.5 

13.4 

14.1 

14.3 


Chiffon 

13.2 

12.7 

12.6 

13.9 


Mazóla 

16.8 

17.2 

16.4 

17.3 

18.0 

Fleischmann ’s 

18.1 

17.2 

18.7 

18.4 



(Los números precedentes son ficticios, aunque las medias 
muéstrales concuerdan con los datos reportados en el ejem¬ 
plar de enero de 1975 de Consumer Reports.) 

a. Use ANOVA para probar en cuanto a diferencias entre 
los porcentajes de ácidos grasos polinsaturados fisioló¬ 
gicamente activos para las distintas marcas. 

b. Calcule intervalos de confianza para todas las (p¡ — pi). 

c. Mazóla y Fleischmann’s son aceites de maíz, en tanto 
que los demás son de soya. Calcule un intervalo de con¬ 
fianza para 

(/x, + ¿i, + p, + pj _ (¿i, + p¿) 

4 2 

[Sugerencia: Modifique la expresión para V(0) que condujo 
a (10.5) en la sección previa.] 

27. Aun cuando el té es la bebida que más se consume en el 
mundo después del agua, se sabe poco sobre su valor nutri- 
cional. La folacina es la única vitamina B presente en cual¬ 
quier cantidad significativa de té y avances recientes en 
métodos de ensayo han determinado con precisión el conte¬ 
nido de folacina factible. Considere los datos adjuntos so¬ 
bre contenido de folacina en especímenes seleccionados al 
azar de las cuatro marcas líderes de té verde. 


Marca Observaciones 


1 

7.9 

6.2 

6.6 

8.6 

8.9 

10.1 9.6 

2 

5.7 

7.5 

9.8 

6.1 

8.4 


3 

6.8 

7.5 

5.0 

7.4 

5.3 

6.1 

4 

6.4 

7.1 

7.9 

4.5 

5.0 

4.0 


(Los datos están basados en “Folacin Contení of Tea”, J. 
Amer. Dietetic Assoc., 1983: 627-632.) ¿Sugieren estos da¬ 
tos que el contenido de folacina promedio verdadero es el 
mismo para todas las marcas? 

a. Realice una prueba con a = 0.05 con el método del va¬ 
lor P. 

b. Evalúe la factibilidad de cualquier suposición requerida 
para su análisis en el inciso a). 

c. Realice un análisis de comparaciones múltiples para 
identificar diferencias significativas entre marcas. 

28. Para un ANOVA unifactorial con tamaños de muestra J¡ 

(i = 1, 2, . . . , 7) demuestre que STCr = — X ..) 2 = 

2 ¡J¡Xl — nX 2 _, donde n = 27,. 

29. Cuando los tamaños de muestra son iguales (J¡ = 7), los pa¬ 
rámetros aq, a 2 , . . . , ot¡ de la parameterización alternativa 


están restringidos por2aq = 0. Con tamaños de muestra de¬ 
siguales, la restricción más natural es 27,-a!,. = 0. Use esto 
para demostrar que 

£(CMTr) = a 2 + 'Zjp 2 

¿Cuál es 7?(CMTr) cuando 77 0 es verdadera? [Esta expre¬ 
sión es correcta si 27 ; a:, = 0 es reemplazada por la restric¬ 
ción Y*ot¡ = 0 (o por cualquier otra restricción lineal sobre las 
a¡ utilizadas para reducir el modelo a I parámetros indepen¬ 
dientes), pero 27,aq — 0 simplifica el álgebra y produce 
estimaciones naturales para los parámetros modelo (en par¬ 
ticular á¡ — x¡. — T..).] 

30 . Reconsidere el ejemplo 10.7 que implica una investigación 
de los efectos de diferentes tratamientos térmicos sobre el 
punto de cedencia de lingotes de acero. 

a. Si7=8yo-=l, ¿cuál es ¡3 para una prueba F a un nivel 
de 0.05 cuando p l = p^ p 3 = p 3 — 1 y p 4 — p¡ + 1? 

b. Con la alternativa del inciso a), ¿qué valor de 7 es nece¬ 
sario para obtener ¡3 = 0.05? 

c. Si existen 7=5 tratamientos térmicos, 7 = 10 y <x = 1, 
¿cuál es ¡3 para la prueba F a un nivel de 0.05 cuando 
cuatro de las p¡ son iguales y la quinta difiere en 1 de las 
otras cuatro? 

31 . Cuando los tamaños de muestra no son iguales, el paráme¬ 
tro de no centralidad es Y.J¡ct 2 /cr 2 y </> 2 = (\II)Y>J¡ci 2 ¡lcr 2 . 
Remitiéndose al ejercicio 22, ¿cuál es la potencia de la 
prueba cuando p 2 = p 3 , p 1 = p 2 — cr y p 4 = p 2 + <r? 

32 . En un experimento para comparar la calidad de cuatro mar¬ 
cas diferentes de cinta de grabar de carrete a carrete, se selec¬ 
cionaron cinco carretes de 2400 pies de cada marca (A-D) y 
se determinó el número de imperfecciones en cada uno. 


A: 

10 

5 

12 

14 

8 

B: 

14 

12 

17 

9 

8 

C: 

13 

18 

10 

15 

18 

D: 

17 

16 

12 

22 

14 


Se cree que el número de imperfecciones tiene aproximada¬ 
mente una distribución Poisson para cada marca. Analice 
los datos al nivel 0.01 con objeto de ver si el número espe¬ 
rado de imperfecciones por carrete es el mismo para cada 
marca. 

33. Suponga que X¡j es una variable binomial con parámetros n 
y p¡ (así que es aproximadamente normal cuando np¡ a 5 y 
nq¡ £ 5). Entonces como p¡ = np¡, V{X3) = er? = np¡( 1 — p¡) 
= p¡{ I — pjri). ¿Cómo se deberán transformar las X¡ 2 de 
modo que se estabilice la varianza? [ Sugerencia: g(p¡) = 
¿i,(l - p,/n).\ 

34. Simplifique EfCMTr) para el modelo de efectos aleatorios 
cuando J l = J 2 = ■ ■ ■ = J¡ = J. 
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EJERCICIOS SUPLEMENTARIOS (35-46) 


35 . Se realizó un experimento para comparar las velocidades de 
flujo de cuatro tipos diferentes de boquilla. 

a. Los tamaños de muestra fueron 5, 6, 7 y 6, respectiva¬ 
mente y los cálculos dieron/= 3.68. Formule y pruebe 
las hipótesis pertinentes con a = 0.01. 

b. El análisis de los datos con un programa estadístico dio el 
valor P = 0.029. Al nivel 0.01, ¿qué concluiría y por qué? 

36 . El artículo “Computer-Assisted Instruction Augmented with 
Planned Teacher/Student Contacts” (7. Exp. Educ., invierno, 
1980-1981: 120-126) comparó cinco métodos diferentes de 
enseñar estadística descriptiva. Los cinco fueron discusión y 
conferencia tradicionales (L/D), instrucción con libro de tex¬ 
to programado (R), texto programado con conferencias 
(R/L), instrucción con computadora (C) e instrucción con 
computadora y conferencias (C/L). Cuarenta y cinco estu¬ 
diantes fueron asignados al azar, 9 a cada método. Después 
de completar el curso, los estudiantes resolvieron un exa¬ 
men de 1 hora. Además, se administró una prueba de reten¬ 
ción de 10 minutos 6 semanas después. Los resultados son 
los siguientes: 


Examen Prueba de retención 


Método 

x ¡- 

h 

x ¡- 


L/D 

29.3 

4.99 

30.20 

3.82 

R 

28.0 

5.33 

28.80 

5.26 

R/L 

30.2 

3.33 

26.20 

4.66 

C 

32.4 

2.94 

31.10 

4.91 

C/L 

34.2 

2.74 

30.20 

3.53 


La gran media del examen fue 30.82 y la de la prueba de re¬ 
tención fue 29.30. 

a. ¿Sugieren estos datos que existe diferencia entre los cin¬ 
co métodos de enseñanza con respecto a la calificación 
del examen media verdadera? Use a — 0.05. 

b. Con un nivel de significación de 0.05, pruebe la hipóte¬ 
sis nula de ninguna diferencia entre las calificaciones de 
la prueba de retención media verdadera para los cinco 
métodos de enseñanza distintos. 

37. Numerosos factores contribuyen al funcionamiento suave 
de un motor eléctrico (“Increasing Market Share Through 
Improved Product and Process Design: An Experimental 
Approach”, Quality Engineering, 1991: 361-369). En par¬ 
ticular, es deseable mantener el ruido del motor y vibraciones 
a un mínimo. Para estudiar el efecto que la marca de los co¬ 
jinetes tiene en la vibración del motor, se examinaron cinco 
marcas diferentes de cojinetes instalando cada tipo de cojine¬ 
te en muestras aleatorias distintas de seis motores. Se regis¬ 
tró la cantidad de vibración del motor (medida en micrones) 
cuando cada uno de los 30 motores estaba funcionando. Los 
datos de este estudio se dan a continuación. Formule y prue¬ 
be las hipótesis pertinentes a un nivel de significación de 0.05 
y luego realice un análisis de comparaciones múltiples si es 
apropiado. 


Media 


Marca 1 

13.1 

15.0 

14.0 

14.4 

14.0 

11.6 

13.68 

Marca 2 

16.3 

15.7 

17.2 

14.9 

14.4 

17.2 

15.95 

Marca 3 

13.7 

13.9 

12.4 

13.8 

14.9 

13.3 

13.67 

Marca 4 

15.7 

13.7 

14.4 

16.0 

13.9 

14.7 

14.73 

Marca 5 

13.5 

13.4 

13.2 

12.7 

13.4 

12.3 

13.08 


38. Un artículo publicado en el diario científico británico Nature 
(“Sucrose Induction of Hepatic Hyperplasia in the Rat”, 25 
de agosto de 1972: 461) reporta sobre un experimento en el 
cual cada uno de cinco grupos compuestos de seis ratas fue 
puesto a dieta con un carbohidrato diferente. Al final del ex¬ 
perimento, se determinó el contenido de ADN del hígado de 
cada rata (mg/g hígado), con los siguientes resultados: 


Carbohidrato 

x ¡- 

Almidón 

2.58 

Sucrosa 

2.63 

Fructosa 

2.13 

Glucosa 

2.41 

Maltosa 

2.49 


Suponiendo también que = 183.4, ¿indican estos 

datos que el tipo de carbohidrato presente en la dieta afecta 
el contenido de ADN promedio verdadero? Construya una 
tabla ANOVA y use un nivel de significación de 0.05. 

39 . Remitiéndose al ejercicio 38, construya un intervalo de con¬ 
fianza t para 

0 = rii - + ri-sV 4 

que mide la diferencia entre el contenido de ADN promedio 
para la dieta de almidón y el promedio combinado para las 
otras cuatro dietas. ¿Incluye cero el intervalo resultante? 

40 . Remítase al ejercicio 38, ¿cuál es ¡3 para la prueba cuando 
el contenido de ADN promedio verdadero es idéntico para 
las tres dietas y queda a 1 desviación estándar (o - ) por deba¬ 
jo de este valor común para las otras dos dietas? 

41 . Se seleccionan al azar cuatro laboratorios (1-4) de una 
población grande y a cada uno se le pide que haga tres de¬ 
terminaciones del porcentaje de alcohol metílico en especí¬ 
menes de un compuesto tomado de un solo lote. Basado en 
los datos adjuntos ¿son las diferencias entre los laboratorios 
una causa de variación del porcentaje de alcohol metílico? 
Formule y pruebe las hipótesis pertinentes con un nivel de 
significación de 0.05. 


1: 

85.06 

85.25 

84.87 

2: 

84.99 

84.28 

84.88 

3: 

84.48 

84.72 

85.10 

4: 

84.10 

84.55 

84.05 


42 . La frecuencia de parpadeo crítica (fpc) es la frecuencia más 
alta (en ciclos/s) a la que una persona puede advertir el par¬ 
padeo en una fuente luminosa parpadeante. A frecuencia 
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por encima de la frecuencia de parpadeo crítica, la fuente 
luminosa parece ser continua aun cuando en realidad parpa¬ 
dee. Una investigación realizada para ver si la frecuencia de 
parpadeo crítica promedio verdadera depende del color del 
iris arrojó los siguientes datos (con base en el artículo “The 
Effects of Iris Color in Critical Flicker Frequency”, J. Ge¬ 
neral Psych., 1973: 91-95): 


Color del iris 


1. Café 

2. Verde 

3. Azul 

26.8 

26.4 

25.7 

27.9 

24.2 

27.2 

23.7 

28.0 

29.9 

25.0 

26.9 

28.5 

26.3 

29.1 

29.4 

24.8 


28.3 

25.7 



24.5 



8 

5 

6 

204.7 

134.6 

169.0 

25.59 

26.92 

28.17 


n = 19 x.. = 508.3 

a. Formule y pruebe las hipótesis pertinentes a un nivel de 
significación de 0.05 utilizando la tabla F para obtener 
un límite superior y/o inferior del valor P. [Sugerencia'. 

12*5 = 13 659.67 y CF = 13 598.36.] 

b. Investigue las diferencias entre colores del iris con res¬ 
pecto a la frecuencia de parpadeo crítica media. 45 , 

43 . Sean c v c 2 , . . ■ , c¡ los números que satisfacen la expresión 
YjC¡ = 0. Entonces 2c,-/ x, = c 1 / ll 1 + • • • + c,/x, se llama 
contraste en las fi¡. Observe que con c¡ = 1, c 2 = — 1, 
c 3 = • • • = Cj = 0, 2c j /A i = /4 — /x 2 , la cual implica que 
toda diferencia tomada por pares entre las ¡jl¿ es un contras¬ 
te (también lo es, p. ej., p. l — 0.5/x 2 — 0.5/x 3 ). Un método 
atribuido a Scheffé da intervalos de confianza simultáneos 
con nivel de confianza simultáneo de 100(1 — a)% para to¬ 


dos los contrastes posibles (¡un número infinito de ellos!). 
El intervalo para 2 ^/ 1 , es 

2c,- x, ± (2c?/7 ,) 1/2 • [(/ - 1) • CME • F aI _ hn _j\ m 

Con los datos de la frecuencia crítica de parpadeo del ejercicio 
42, calcule los intervalos de Scheffé para los contrastes 
/x, — p, 2 , p.¡ — p 3 , ¡jí 2 - p, 3 y 0.5 /jíj + 0.5 fL 2 - p . 3 (este últi¬ 
mo contraste compara el azul con el promedio del café y el 
verde). ¿Que contrastes aparecen significativamente difer¬ 
entes de 0 y por qué? 

Cuatro tipos de morteros: mortero de cemento ordinario 
(MCO), mortero impregnado de polímero (MIP), mortero 
con resina (MR) y mortero con cemento y polímero (MCP), 
se sometieron a una prueba de compresión para medir resis¬ 
tencia (MPa). Tres observaciones de resistencia de cada tipo 
de mortero se dan en el artículo. “Polymer Mortar Composi- 
te Matrices for Maintenance-Free Highly Durable Ferroce- 
ment” ( J. Ferrocement, 1984: 337-345) y se reproducen 
aquí. Construya una tabla ANOVA. Con un nivel de signifi¬ 
cación de 0.05, determine si los datos sugieren que la resis¬ 
tencia media verdadera no es la misma para los cuatro tipos 
de morteros. Si determina que las resistencias medias ver¬ 
daderas no son iguales, use el método de Tukey para identi¬ 
ficar las diferencias significativas. 


MCO 

32.15 

35.53 

34.20 

MIP 

126.32 

126.80 

134.79 

MR 

117.91 

115.02 

114.58 

MCP 

29.09 

30.87 

29.80 


Suponga que las x- están “codificadas” por y- = cx ¡2 + d. 
¿Cómo se compara el valor del estadístico F calculado con 
las y, y con el valor calculado con las x¡f! Justifique su aseve¬ 
ración. 

46. En el ejemplo 10.10, reste x¡ de cada observación en la 
í-ésima muestra (i = 1 , . . . , 6 ) para obtener un conjunto de 
18 residuos. Luego construya una curva de probabilidad 
normal y comente sobre la factibilidad de la suposición 
de normalidad. 
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Análisis de varianza 
con varios factores 


INTRODUCCION 

En el capítulo previo, se utilizó el análisis de la varianza (ANOVA) para probar en 
cuanto a igualdad de / medias de población diferentes o las respuestas promedio 
verdaderas asociadas con / niveles distintos de un solo factor (alternativamente co¬ 
nocidos como / tratamientos diferentes). En muchas situaciones experimentales, 
existen dos o más factores que son de interés simultáneo. Este capítulo amplía los 
métodos del capítulo 10 para investigar tales situaciones multifactoriales. 

Las dos primeras secciones se concentran en el caso de dos factores de interés. 
Se utilizará / para denotar el número de niveles del primer factor (A) y J para denotar 
el número de niveles del segundo factor (B). Entonces existen IJ combinaciones posibles 
compuestas de un nivel del factor A y uno del factor 6; cada una de tales combina¬ 
ciones se conoce como tratamiento, de ahí que existen IJ tratamientos diferentes. El 
número de observaciones realizadas en el tratamiento (/,_/) serán denotadas por K¡j. 
En la sección 11.1, se considera K¡j = 1. Un caso especial importante de este tipo es 
un diseño de bloque aleatorizado, en el cual un solo factor A es de primordial inte¬ 
rés pero se crea otro factor, "bloques", para controlar la variabilidad externa en uni¬ 
dades o sujetos experimentales. En la sección 11.2, se aborda el caso K¡j = K > 1 y 
se mencionan brevemente las dificultades asociadas con K¡j desiguales. 

La sección 11.3 considera experimentos que implican más de dos factores, in¬ 
cluido un diseño de cuadro latino, el cual controla los efectos de dos factores exter¬ 
nos que se piensa influyen en la variable de respuesta. Cuando el número de factores 
es grande, un experimento compuesto de por lo menos una observación por cada 
tratamiento sería caro y consumiría mucho tiempo. Un caso especial importante, el 
cual se discute en la sección 11.4, es aquel en el cual existen p factores, cada uno de 
los cuales tiene dos niveles. Existen entonces 2 p tratamientos diferentes. Se considera 


397 
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tanto el caso en el cual las observaciones se realizan en todos estos tratamientos (un di¬ 
seño completo) y el caso en el cual las observaciones se realizan en sólo un subconjun¬ 
to de tratamientos (un diseño incompleto). 


| 11.1 ANOVA bifactorial con K¡j = 1 

Cuando el factor A consta de I niveles y el factor B de J niveles, existen IJ combinaciones 
diferentes (pares) de niveles de los dos factores, cada uno llamado tratamiento. Con K¡- = 
el número de observaciones en el tratamiento compuesto del factor A al nivel i y del factor 
B al nivel j, esta sección se enfoca en el caso K¡¡ = 1, de modo que los datos se componen 
de IJ observaciones. Primero se discutirá el modelo de efectos fijos, en el cual los únicos ni¬ 
veles de interés con los dos factores son aquellos que en realidad están representados en el 
experimento. El caso en el cual un factor es aleatorio se discute con brevedad al final de la 
sección. 


Ejemplo 11.1 ¿Es realmente fácil eliminar manchas en telas producidas por plumas de tinta borrable co¬ 
mo la palabra borrable podría implicar? Considere los siguientes datos de un experimento 
para comparar tres marcas diferentes de plumas y cuatro tratamientos de lavado distintos 
con respecto a su capacidad de eliminar manchas en un tipo particular de tela (basado en “An 
Assessment of the Effects of Treatment, Time, and Heat on the Renoval of Erasable Pen 
Marks from Cotton and Cotton/Polyester Blend Fabrics”, J. ofTesting and Evaluation, 1991: 
394-397). La variable de respuesta es un indicador cuantitativo del cambio de color total de 
un espécimen de tela; mientras más bajo fue este valor, más manchas fueron eliminadas. 


Tratamiento de lavado 


Marca de pluma 



1 

2 

3 

4 

Total 

Promedio 

1 

0.97 

0.48 

0.48 

0.46 

2.39 

0.598 

2 

0.77 

0.14 

0.22 

0.25 

1.38 

0.345 

3 

0.67 

0.39 

0.57 

0.19 

1.82 

0.455 

Total 

2.41 

1.01 

1.27 

0.90 

5.59 


Promedio 

0.803 

0.337 

0.423 

0.300 


0.466 



¿Existe alguna diferencia en la cantidad de cambio de color promedio verdadero debido a 
las diferentes marcas de pluma o a los distintos tratamientos de lavado? ■ 

Como en el ANOVA unifactorial, se utilizan subíndices dobles para identificar varia¬ 
bles aleatorias y valores observados. Sea 

X- = la variable aleatoria (va) que denota la medición cuando el factor A se 
mantiene al nivel i y el factor B al nivel j. 

x¡j = el valor observado de X tj . 

Las x¡j normalmente se presentan en una tabla de dos vías en la cual la í-ésima fila contiene 
los valores observados cuando el factor A se mantiene al nivel i y la /-ésima columna con¬ 
tiene los valores observados cuando el factor B se mantiene al nivel j. En el experimento de 
la pluma de tinta borrable del ejemplo 11.1, el número de niveles del factor A es /= 3, el 
número de niveles del factor B es J = 4, x 13 = 0.48, x 22 = 0.14, etcétera. 
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En tanto que en el ANOVA unifactorial, lo que interesaba eran las medias que apare¬ 
cían en las filas y la gran media, en este caso también existe interés en las medias que apa¬ 
recen en las columnas. Sea 


— el promedio de las mediciones obtenidas 
'• cuando el factor A se mantiene al nivel i 


— el promedio de las mediciones obtenidas 
cuando el factor B se mantiene al nivel j 


X.. = la gran media 


J 

I 

= j ^_L 




j 


i 


2 X, 


= 1=1 


I J 

= 1-17-1 

IJ 


con los valores observados x¡., x.j y 3c... Los totales en lugar de los promedios se denotan 
omitiendo la raya horizontal (por lo tanto jc • = Yj¡x¡p etc.). Intuitivamente, para ver si exis¬ 
te algún efecto debido a los niveles del factor A, se deberán comparar las x¡. observadas una 
con otra y se deberá sacar información de las 3c.,- con respecto a los diferentes niveles del 
factor B. 


El modelo de efectos fijos 

Procediendo por analogía con el ANOVA unifactorial, la primera tendencia al especificar un 
modelo es hacer ¡i¡j = la respuesta promedio verdadera cuando el factor A se encuentra al 
nivel i y el factor B al nivel j, para obtener parámetros medios IJ. En ese caso sea 

x ¡j = /A + e ,j 

donde e, ; es la cantidad aleatoria en la cual el valor observado difiere de su expectativa y las 
e¡j se suponen normales e independientes con varianza común cr 2 . Desafortunadamente, no 
existe un procedimiento de prueba válido para esta selección de parámetros. La razón es que 
conforme a la hipótesis alternativa de interés, las /x y son libres de adoptar cualquier valor, 
en tanto que a 2 puede tener cualquier valor mayor que cero, así que existen IJ + 1 paráme¬ 
tros libremente variables. Pero existen sólo IJ observaciones, así que después de utilizar 
cada x¡j como estimación de ¡ jl ¡ ¡, no hay forma de estimar cr. 

Para rectificar este problema de un modelo que tiene más parámetros que valores obser¬ 
vados, se debe especificar uno que sea realista y que también implique relativamente pocos 
parámetros. 


Supóngase la existencia de I parámetros a¡, a 2 , . . . , a¡ y 7 parámetros fi t , jS 2 , . . . , 
/3 j de tal suerte que 

X ij = a ¡ +fij +€ tj (¿= 1 , ...,/, 7 = 1 ,..., J) ( 11 . 1 ) 

de modo que 

/Ly = «, + Pj (11-2) 


Incluida cr, ahora hay / + / + 1 parámetros de modelo, así que si I > 3 y J 2r 3, entonces 
habrá menos parámetros que observaciones (de hecho, en breve se modificará (11.2) de mo¬ 
do que incluso 1=2 y/o 7=2 tendrán cabida). 

El modelo especificado en (11.1) y (11.2) se llama modelo aditivo porque cada res¬ 
puesta media /x- es la suma de un efecto debido al factor A al nivel i (a¡) y un efecto debido 
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al factor B al nivel j (j8). La diferencia entre las respuestas medias con el factor al nivel i 
y al nivel i' cuando B se mantiene al nivel j es p. (( — fi¡,j. Cuando el modelo es aditivo, 

B,j ~ Pi'j = («,■ + Pj) ~ («,- + Pj) = «,■ - «,■' 

la cual es independiente del nivel j del segundo factor. Un resultado similar prevalece para 
H,¡j — i± u ‘. Así, aditividad significa que la diferencia en las respuestas medias a dos niveles 
de uno de los factores es la misma a todos los niveles del otro factor. La figura 11.1a) mues¬ 
tra un conjunto de respuestas medias que satisfacen la condición de aditividad y la figura 
11 .1b) muestra una configuración no aditiva de respuestas medias. 




Figura 11.1 Respuestas medias de dos tipos de modelo: a) aditivo; b) no aditivo. 


Ejemplo 11.2 

(continuación 
del ejemplo 
11 . 1 ) 


Cuando se grafican las x, ; de una manera análoga a la de la figura 11.1, se obtiene el resul¬ 
tado mostrado en la figura 11.2. Aunque existe algo de “cruzamiento” en las x tJ observadas, 
la configuración es razonablemente representativa de lo que se esperaría bajo aditividad con 
sólo una observación por tratamiento. 



Cambio de color 



Tratamiento de lavado 


Figura 11.2 Diagrama de los datos del ejemplo 11.1. 
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La expresión (11.2) no describe del todo el modelo final porque las a¡ y las /3 ; no es¬ 
tán determinadas de forma única. A continuación se dan configuraciones diferentes de las 
a¡ y j8 ; que dan las mismas aditivas. 


J3i=l (3 2 = 4 /3, = 2 /3 2 = 5 


J5 

II 

Bu 2 

Bn 3 

II 

O 

Bu ^ 

B¡2 5 

«2 = 2 

Bu = 3 

B22 ~ 6 

a 2 = 1 

Bu ~ 3 

M-22 — ^ 


Si se resta cualquier constante c de todas las a¡ y se suma a todas las jS ■ se obtienen otras 
configuraciones correspondientes al mismo modelo aditivo. Esta no singularidad se elimi¬ 
na con el uso del siguiente modelo. 


x ij ~ B + a , + Pj + € y (11.3) 

/ J 

donde X = 0, X /3- = 0 y las e. se suponen independientes, normalmente dis- 
¿=1 7=1 

tribuidas, con media 0 y varianza común a 2 . 


Esto es análogo a la selección alternativa de parámetros para el método ANOVA unifacto- 
rial discutido en la sección 10.3. No es difícil verificar que (11.3) es un modelo aditivo en 
el cual los parámetros están determinados de forma única (por ejemplo, para las /x y antes 
mencionadas, ¡x = 4 , aq = —0.5, a-, = 0.5, /3¡ = —1.5 y j8, = 1.5). Obsérvese que hay 
sólo / - la, determinadas de manera independiente y J - I (i J independientemente determi¬ 
nadas, así que (incluida /x) (11.3) especifica I + J - 1 parámetros medios. 

La interpretación de los parámetros de (11.3) es directa: ¡x es la gran media verdade¬ 
ra (respuesta media promediada a todos los niveles de ambos factores), a¡ es el efecto del 
factor A al nivel i (medido como una desviación con respecto a /i) y j3 ; es el efecto del fac¬ 
tor B al nivel j. Estimadores insesgados (y la máxima verosimilitud) de estos parámetros son 

pL=X.. á¡ = X¡. - X.. = X.j - X.. 

Existen dos hipótesis diferentes de interés en un experimento de dos factores con Ky = 1 . 
La primera, denotada por H 0A , establece que los distintos niveles del factor A no tienen efec¬ 
to en la respuesta promedio verdadera. La segunda, denotada por H 0B asevera que el factor 
B no tiene ningún efecto. 


h oa- «i = «2 =•••=“/= 0 

contra por lo menos una ot { A 0 

M ‘ (11.4) 

Hqb- Pi ~ ~~ ' ' ’ — Pj — 0 

contra /7 a/¡ : por lo menos una /3 A 0 


(Ningún efecto del factor A implica que todas las a¡ son iguales, así que todas deben ser 0 
puesto que suman 0 y asimismo para las /3 ; .) 

Procedimientos de prueba 

La descripción y análisis ahora siguen de cerca a los del ANOVA unifactorial. Las sumas de 
los cuadrados pertinentes y los grados de libertad asociados son los siguientes: 


























CAPITULO 11 Análisis de varianza con varios factores 


DEFINICIÓN 


Ejemplo 11.3 

(continuación 
del ejemplo 
11 . 2 ) 


1 J _ 

stc = Z 2 (x tJ - x.y g i = u- i 

¿=17=1 

7 / _ _ 7 _ _ 

SCA = 2 1 (X, - XJ 2 = j2 (X;- X..) 2 gl = / - 1 
1 = 17=1 i=l 

7 J _ _ J _ _ 

scb = E £ {x.j - x.y = /£ (x.j— x.y gi = j - i 

1=17=1 7=1 

7 7 _ _ _ 

SCE = £ £ (X.j - x, - X.J + x.y 

1 = 17=1 


(11.5) 


gl = (/ - 1)(/-1) 


La identidad fundamental es 

STC = SCA + SCB + SCE 


( 11 . 6 ) 


Existen fórmulas de cálculo para STC, SCA y SCB análogas a las que aparecen en el capí¬ 
tulo 10 para el ANOVA unifactorial. Pero la amplia disponibilidad de programas estadísti¬ 
cos ha vuelto a estas fórmulas casi obsoletas. 

La expresión para SCE se obtiene al reemplazar /r, a¡ y jS■ por sus estimadores en 
nx t] -ox + a¡ + jS,)] 2 - El grado de libertad asociado con el error es IJ — número de pa¬ 
rámetros medios estimado = IJ — [1 + (7 — 1) + (/ — 1)] = (/ — 1 )(J — 1). Como en el 
ANOVA unifactorial, la variación total se divide en una parte (SCE) que no está explicada 
por la verdad o falsedad de H 0A o H 0B y dos partes que pueden ser explicadas por la posible 
falsedad de las dos hipótesis nulas. 

La teoría estadística ahora estipula que si se forman proporciones F como en el ANOVA 
unifactorial, cuando H 0A (H w ) es verdadera, la proporción F correspondiente tiene una dis¬ 
tribución F con grados de libertad asociados con el numerador = I — 1 (7 — 1) y grados de 
libertad asociados con el denominador = (/ — 1)(7 — 1). 


Hipótesis 

Valor del estadístico de prueba 

Región de rechazo 

H oa contra 

_ MCA 

ÍA MCE 

T 

7 

7 

Al 

H ob contra 7/ a/J 

MCB 
' B MCE 

7 

7 

i 

t, a 

Al 


Las x¡. y x para los datos de cambio de color se muestran a lo largo de los márgenes dere¬ 
cho e inferior de la tabla de datos dada previamente. La tabla ANOVA adjunta (tabla 11.1) 
resume los cálculos adicionales. 


Tabla 11.1 Tabla ANOVA para el ejemplo 11.3 

Origen de la variación gl Suma de cuadrados Cuadrado de la media / 


Factor A (marca) 
Factor B 
(tratamiento 
de lavado) 
Error 
Total 


7-1 = 2 


7- 1 = 3 

(/- D(y- i) = 6 

IJ - 1 = 11 


SCA = 0.1282 


SCB = 0.4797 
SCE = 0.0868 
STC = 0.6947 


MCA = 0.0641 f A = 4.43 

MCB = 0.1599 f B = 11.05 

MCE = 0.01447 
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El valor crítico para probar H 0A a un nivel de significación de 0.05 es F 0 05 2 6 = 5.14. Como 
4.43 < 5.14, H oa no puede ser rechazada a un nivel de significación de 0.05. Aparentemen¬ 
te el cambio de color promedio verdadero no depende de la marca de la pluma. Como 
f o 05 3 g = 4.76 y 11.05 > 4.76, H w es rechazada a un nivel de significación de 0.05 a favor 
de la aseveración de que el cambio de color varía con el tratamiento de lavado. Un progra¬ 
ma de cálculo estadístico da valores P de 0.066 y 0.007 para estas dos pruebas. ■ 

La factibilidad de las suposiciones de normalidad y varianza constante puede ser in¬ 
vestigada de forma gráfica. Se definen los valores pronosticados (también llamados valores 
ajustados ) x¡j = j± + ol¡ + = x.. + ( x¡ . — x..) + (x.j — x..) = x¡. + x.¡ — x.., y los 

residuos (las diferencias entre las observaciones y los valores pronosticados) x, ; — x- = 
x y — x u — x.j + x... Se puede verificar la suposición de normalidad con un diagrama de 
probabilidad normal de los residuos y la suposición de varianza constante con un diagrama 
de los residuos contra los valores ajustados. La figura 11.3 muestra estos diagramas para los 
datos del ejemplo 11.3. 



Diagrama de probabilidad normal de los residuos 



Residuos contra los valores ajustados 

0.15 
0.10 

0.05 

0.0 

-0.5 
- 0.10 


0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 
Valor ajustado 

b) 


Figura 11.3 Diagramas de diagnóstico obtenidos con MINITAB para el ejemplo 11.3. 



El diagrama de probabilidad normal es razonablemente recto, de modo que no existe 
ninguna razón para cuestionar la normalidad de este conjunto de datos. En el diagrama de 
residuos contra valores ajustados, se buscan diferencias en dispersión vertical conforme 
se recorre la gráfica horizontalmente de un lado a otro. Por ejemplo, si hubiera un rango an¬ 
gosto de valores ajustados pequeños y un rango amplio de valores ajustados altos, esto 
sugeriría que la varianza es más grande con respuestas grandes (esto sucede a menudo y en 
ocasiones puede ser remediado reemplazando cada observación por su logaritmo). En este 
caso no ocurre semejante problema, así que no existe evidencia en contra de la suposición 
de varianza constante. 


Cuadrados de la media esperada 

La factibilidad de utilizar las pruebas F que se acaban de describir se demuestra calculando 
el cuadrado de la media esperada. Luego de algo de álgebra tediosa. 


£(MCE) = cr 2 (cuando el modelo es aditivo) 


£(MCA) = a 2 + 


J 


H a? 


i -1 ¿r, 
j 


2 # 


j -1 ^ 


£(MCB) = o- 2 + 
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Cuando H 0A es verdadera, MCA es un estimador insesgado de cr 2 , así F es una proporción 
de dos estimadores insesgados cr 2 . Cuando H 0A es falsa, MCA tiende a sobrestimar cr 2 , de 
tal suerte que H 0A deberá ser rechazada cuando la proporción F A es demasiado grande. Co¬ 
mentarios similares se aplican a MCB y H m . 


Comparaciones múltiples 

Cuando H 0A o H 0B han sido rechazadas, se puede utilizar el procedimiento de Tukey para 
identificar diferencias significativas entre los niveles del factor investigado. Los pasos en el 
análisis son idénticos a aquellos para un ANOVA unifactorial: 


1. Para comparar niveles del factor A, se obtiene Q a i(i-\)u-\r 
Para comparar niveles del factor B, se obtiene Q aJ(l ¡ )(/ ! : , 

2. Se calcula 


w = Q • (desviación estándar estimada de las medias 
muéstrales comparadas) 

Q a j (/—!)(/—i) ‘ VMCE// para comparaciones del factor A 
Qtij(i-\)(j- o' V MCE// para comparaciones del factor B 
(porque, p. ej., la desviación estándar de X¡. es cr/V/). 


3. Se ordenan las medias muéstrales en orden creciente, se subrayan los pares que difieren 
menos de w y se identifican los pares no subrayados por la misma línea como correspon¬ 
dientes a niveles significativamente diferentes del factor dado. 


Ejemplo 11.4 

(continuación 
del ejemplo 
11.3) 


La identificación de diferencias significativas entre los cuatro tratamientos de lavado requiere 
2 0 0546 = 4.90 y w = 4.90 V(0.01447)/3 = 0.340. Las cuatro medias muéstrales corres¬ 
pondientes al factor B (promedios en columnas) ahora aparecen en orden creciente y cual¬ 
quier par que difiere por menos de 0.340 aparece subrayado por un segmento de línea: 


x 4 . x 2 , x 3 . x¡. 

0.300 0.337 0.423 0.803 


Parece que el tratamiento de lavado 1 difiere significativamente de los otros tres, aunque no 
están identificadas ningunas otras diferencias. En particular, no es aparente cuál entre los 
tratamientos 2, 3 y 4 es mejor para eliminar manchas. ■ 


Experimentos de bloque aleatorizado 

Cuando se utiliza el ANOVA unifactorial para probar en cuanto a la presencia de efectos 
debidos a los I tratamientos diferentes estudiados, una vez que los IJ sujetos o unidades ex¬ 
perimentales han sido seleccionados, el tratamiento se asignará en una forma completamen¬ 
te al azar. Es decir, se deberán seleccionar al azar J sujetos para el primer tratamiento, luego 
otra muestra de J sujetos seleccionados al azar de los IJ — J sujetos restantes para el segun¬ 
do tratamiento y así sucesivamente. 

Sucede con frecuencia, no obstante, que los sujetos o unidades experimentales exhiban 
heterogeneidad con respecto a otras variables que pueden afectar las respuestas observadas. 
Cuando este es el caso, la presencia o ausencia de un valor F significativo puede deberse a 
esta variación externa y no a la presencia o ausencia de efectos factoriales. Esta fue la razón 
para la introducción de un experimento apareado en el capítulo 9. La analogía con un expe¬ 
rimento apareado cuando I > 2 se llama experimento de bloque aleatorizado. Un factor ex¬ 
terno, “bloques”, se construye dividiendo las IJ unidades en J grupos con I unidades 
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en cada grupo. Este agrupamiento o formación de bloques se realiza de tal modo que den¬ 
tro de cada bloque las I unidades son homogéneas con respecto a otros factores que se pien¬ 
sa afectan las respuestas. Entonces dentro de cada bloque homogéneo, los I tratamientos se 
asignan al azar a las I unidades o sujetos presentes en el bloque. 

Una organización de prueba de productos de consumo deseaba comparar el consumo de 
energía anual de cinco marcas diferentes de deshumidificadores. Como el consumo de ener¬ 
gía depende del nivel de humedad prevaleciente, se decidió monitorear cada marca a cuatro 
niveles distintos desde humedad moderada hasta intensa (formando así un bloque con el ni¬ 
vel de humedad). Dentro de cada nivel, se asignaron las marcas al azar a los cinco lugares 
seleccionados. La cantidad resultante de consumo de energía (kWh anuales) aparece en la 
tabla 11 . 2 . 


Tabla 11.2 Datos de consumo de energía del ejemplo 11.5. 


Tratamientos 

(marcas) 

Bloques (nivel de humedad) 
12 3 4 

*;• 

x i■ 

1 

685 

792 

838 

875 

3190 

797.50 

2 

722 

806 

893 

953 

3374 

843.50 

3 

733 

802 

880 

941 

3356 

839.00 

4 

811 

888 

952 

1005 

3656 

914.00 

5 

828 

920 

978 

1023 

3749 

937.25 

*■] 

3779 

4208 

4541 

4797 

17 325 


x i 

755.80 

841.60 

908.20 

959.40 


866.25 


Los cálculos ANOVA se resumen en la tabla 11.3 


Tabla 11.3 Tabla ANOVA para el ejemplo 11.5 


Origen de la variación 

gl 

Suma de cuadrados 

Cuadrados de la media 

/ 

Tratamientos (marcas) 

4 

53 231.00 

13,307.75 

/a= 95.57 

Bloques 

3 

116217.75 

38,739.25 

fs = 278.20 

Error 

12 

1671.00 

139.25 


Total 

19 

171 119.75 




Como Fq 05 412 = 3.26 y f A = 95.57 > 3.26, H 0 es rechazada en favor de H d y se concluye que 
el consumo de energía sí depende de la marca del humidificador. Para identificar marcas 
significativ amente d iferentes, se utiliza el procedimiento de Tukey, <2oo5 5 i 2 = 4.51 y 
vv = 4.51V139.25/4 = 26.6. 

x h x 3 . x 2 . x 4 . x 5 . 

797.50 839.00 843.50 914.00 937.25 

El subrayado indica que las marcas pueden dividirse en tres grupos con respecto al consu¬ 
mo de energía. 

Como el factor de bloque es de interés secundario, no se requiere ^0.05,3,12’ aun cuando el 
valor calculado de F B es con claridad altamente significativo. La figura 11.4 muestra los resul¬ 
tados generados por el software estadístico SAS (Analysis of Small Sample) de ANOVA con 
estos datos. Obsérvese que en la primera parte de la tabla ANOVA, la suma de los cuadrados 
(SC) para tratamientos (marcas) y bloques (niveles de humedad) se combinan en un sola suma 
de los cuadrados “modelo” SC. 
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Analysis of Variance Procedure 


Dependent Variable: POWERUSE 





Sum of 

Mean 



Source 


DF 

Squares 

Square 

F Valué 

Pr > F 

Model 


7 

169448.750 

24206.964 

173.84 

0.0001 

Error 


12 

1671.000 

139.250 



Corrected 

Total 

19 

171119.750 





R-Square 


C.V. 

Root MSE 

POWERUSE Mean 



0.990235 


1.362242 

11.8004 

866.25000 


Source 

DF 


Anova SS 

Mean Square 

F Valué 

PR > F 

BRAND 

4 


53231.000 

13307.750 

95.57 

0.0001 

HUMIDITY 

3 


116217.750 

38739.250 

278.20 

0.0001 


Alpha = 0.05 df = 12 MSE = 139.25 
Critical Valué of Studentized Range = 4.508 
Minimum Significant Difference = 26.597 

Means with the same letter are not significantly different. 


Tukey 


Grouping 

Mean 

N 

BRAND 

A 

937.250 

4 

5 

A 




A 

914.000 

4 

4 

B 

843.500 

4 

2 

B 




B 

839.000 

4 

3 

C 

797.500 

4 

1 


Figura 11.4 Resultados obtenidos con SAS con los datos de consumo de energía. ■ 


En muchas situaciones experimentales en las que los tratamientos tienen que ser aplica¬ 
dos a sujetos, uno solo de ellos puede recibir todos los I tratamientos. La formación de bloques 
se realiza entonces con los sujetos mismos para controlar la variabilidad entre ellos; se dice en¬ 
tonces que cada sujeto actúa como su propio control. Los científicos sociales en ocasiones se 
refieren a tales experimentos como diseños de medidas repetidas. Las “unidades” dentro de un 
bloque son entonces las distintas “instancias” de aplicación de tratamiento. Del mismo modo, 
los bloques se consideran como lapsos de tiempo, ubicaciones u observadores diferentes. 

Ejemplo 11.6 Los datos que aparecen en la tabla 11.4 se tomaron del artículo “Compounding of Discri- 
minative Stimuli from the Same and Different Sensory Modalities” ( J. Experimental Analy¬ 
sis Behavior, 1971: 337-342). La respuesta de las ratas se mantuvo mediante programas de 
reforzamiento de intervalo fijo en la presencia de un tono o dos luces distintas. Las luces 
fueron de moderada (Ll) o de baja intensidad (L2). Las observaciones se dan como el nú¬ 
mero medio de respuestas emitidas por cada sujeto durante presentaciones de estímulos úni¬ 
cos y compuestos durante 4 días. 


Tabla 11.4 Datos de respuesta del ejemplo 11.6 





Sujeto 




Estímulo 

1 

2 

3 

4 

*;■ 

*;■ 

Ll 

8.0 

17.3 

52.0 

22.0 

99.3 

24.83 

L2 

6.9 

19.3 

63.7 

21.6 

111.5 

27.88 

Tono (T) 

9.3 

18.8 

60.0 

28.3 

116.4 

29.10 

Ll + L2 

9.2 

24.9 

82.4 

44.9 

161.4 

40.35 

Ll + T 

12.0 

31.7 

83.8 

37.4 

164.9 

41.23 

L2 + T 

9.4 

33.6 

96.6 

40.6 

180.2 

45.05 

x j 

54.8 

145.6 

438.5 

194.8 

833.7 



9.13 

24.27 

73.08 

32.47 


34.74 
























Los cálculos ANOVA se resumen en la tabla 11.5. 


11.1 ANOVA bifactorial con K¡¡ =1 407 


Tabla 11.5 Tabla ANOVA del ejemplo 11.6 


Origen de la variación 

gl 

Suma de cuadrados 

Cuadrado de la media 

/ 

Estímulo (A) 

5 

1428.28 

285.66 

Ía= 5.49 

Sujetos ( B ) 

3 

13444.63 

4481.54 

f B = 86.12 

Error 

15 

780.65 

52.04 


Total 

23 

15 653.56 




Como F 0055 15 = 2.90 y 5.49 > 2.90, se concluye que existen diferencias en las respuestas 
promedio verdaderas asociadas con los diferentes estímulos. Para el procedimiento de Tu- 
key, w = 4.59 V52.04/4 = 16.56. 

X,. x 2 . x 3 . x 4 . x 5 . x 6 . 

24.83 27.88 29.10 40.35 41.23 45.05 


Por lo tanto L1 como L2 son significativamente distintas de L2 + T y no existen otras di¬ 
ferencias significativas entre los estímulos. ■ 

En la mayoría de los experimentos de bloques aleatorizados en los cuales los suje¬ 
tos se desempeñan como bloques, los sujetos que en realidad participan en el experimento se 
seleccionan de una gran población. Los sujetos contribuyen entonces con efectos aleatorios 
en lugar de fijos. Esto no afecta el procedimiento de comparar tratamientos cuando K¡■ = 1 
(una observación por “celda” como en esta sección), pero el procedimiento cambia si = 
K > 1. En breve se considerarán dos modelos de factor en los cuales los efectos son alea¬ 
torios. 

Más sobre formación de bloques Cuando I = 2, se puede utilizar la prueba F o la prueba t 
de diferencias apareadas para analizar los datos. La conclusión resultante no dependerá de 
cuál procedimiento se utilice, puesto que T 2 = F y t 2 l2 v = F alv . 

Al igual que con la formación de pares, la formación de bloques implica tanto una ga¬ 
nancia como una pérdida potencial de precisión. Si existe una gran cantidad de heterogenei¬ 
dad en las unidades experimentales, el valor del parámetro de varianza cr 1 en el modelo 
unidireccional será grande. El efecto de la formación de bloques es filtrar la variación re¬ 
presentada por a 2 en el modelo bidireccional apropiado para un experimento de bloques 
aleatorizados. Con las demás cosas iguales, un valor de cr más pequeño da por resultado 
una prueba que es más probable que detecte alejamientos de H 0 (es decir, una prueba con 
mayor potencia). 

Sin embargo, las demás cosas no son iguales aquí, puesto que la prueba F unifactorial 
está basada en I(J — 1) grados de libertad (gl) en el caso de error, en tanto que la prueba F 
bifactorial se basa en (/ — 1)(/ — 1) grados de libertad en el caso de error. Pocos grados de 
libertad en el caso de error reducen la potencia, en esencia porque el estimador asociado con 
el denominador de a 2 no es tan preciso. Esta pérdida de grados de libertad puede ser espe¬ 
cialmente seria si el experimentador sólo puede permitirse un pequeño número de observa¬ 
ciones. No obstante, si la formación de bloques reduce significativamente la variabilidad, 
quizá valdrá la pena la pérdida de grados de libertad. 

Modelos de efectos aleatorios 

En muchos experimentos, los niveles de un factor utilizados en el experimento, y no los que 
interesan al experimentador, se seleccionan de una población mucho más grande de niveles 
posibles del factor. En una situación de dos factores, cuando este es el caso para ambos fac¬ 
tores, un modelo de efectos aleatorios es apropiado. El caso en el cual los niveles de un 
factor son los únicos de interés y los niveles del otro factor se seleccionan de una población 
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de niveles conduce a un modelo de efectos combinados. El modelo de efectos aleatorios 
bifactorial cuando K¡¡ = 1 es 

v 

X¡¡ = /i + A¡ + Bj + e¡j 0=1,...,/, 

donde las A¡, B¡ y e- son variables aleatorias independientes normalmente distribuidas 
con media 0 y varianzas cr\, cr B y cr 1 2 , respectivamente. Las hipótesis de interés son enton¬ 
ces H oa : (t\ = 0 (el nivel del factor A no contribuye a la variación de la respuesta) contra 
°Í > 0 y H ob : a 2 B = 0 contra H^: a 2 > 0. En tanto que E(MCE) = cr 2 como antes, los 
cuadrados de la media esperados para los factores Ay B ahora son 

£(MCA) = cr 2 + Ja 2 £(MCB) = cr 2 + lo 2 

Por consiguiente, cuando H 0A ( H 0B ) es verdadera, F A (F B ) sigue siendo la razón de dos esti¬ 
madores insesgados de cr 2 . Se puede demostrar que una prueba al nivel a para H 0A contra 
H íA aún rechaza H 0A si f A > F a , , (í _, )(J _,, y, asimismo, se utiliza el mismo procedimiento 
que antes para decidir entre H w y fl. lB . 

Para el caso en el cual el factor A es fijo y el B es aleatorio, el modelo combinado es 
X¡j = M + a¡ + Bj + e- (i = 1, .... 7, j = 1, . . . , J) 

donde = 0 y las B¡ y e l; están normalmente distribuidas con media 0 y varianzas cr 2 B y 
cr 2 , de manera respectiva. Ahora las dos hipótesis nulas son 

# 04 : «i = •••=“/ = 0 y H ob : cr 2 = 0 
con los cuadrados de la media esperados 

£(MCE) = o- 2 E(MCA) = o 2 + y^y2> 2 £(MCB) = cr 2 + lo 2 

Los procedimientos de prueba para H 0A contra ll. IÁ y H w contra f/, l/( son exactamente como 
antes. Por ejemplo, en el análisis de los datos de cambio de color en el ejemplo 11.1, si los 
cuatro tratamientos de lavado fueron seleccionados al azar, entonces como f B = 11.05 y 
F OOS36 = 4.76, H ob : cr B = 0 es rechazada a favor de // aB : cr 2 B > 0. Entonces (MCB — 
MCE)// = 0.0485 da una estimación del “componente de varianza” cr|. 

En resumen, cuando K¡- = 1, aunque las hipótesis y los cuadrados de la media espe¬ 
rados difieren con ambos efectos fijos, los procedimientos de prueba son idénticos. 



EJERCICIOS Sección 11.1 (1-15) 


1. Se determinó el número de millas de desgaste útil de la ban¬ 
da de rodamiento (en miles) de neumáticos de cada uno de 
cinco marcas diferentes de carros subcompactos (factor A, 
con / = 5) en combinación con cada una de cuatro marcas 
diferentes de neumáticos radiales (factor B, con J = 4) y se 
obtuvieron IJ = 20 observaciones. Se calcularon entonces 
los valores SCA = 30.6, SCB = 44.1 y SCE = 59.2. Su¬ 
ponga que un modelo aditivo es apropiado. 

a. Pruebe H 0 : aq = ot 2 = ct 3 = a A = <r 5 = 0 (no hay dife¬ 
rencias en la vida útil de los neumáticos promedio ver¬ 
dadera a causa de las marcas de los carros) contra Hy. 
por lo menos a¡ F 0 con una prueba al nivel de 0.05. 

b. H 0 : j3¡ = |3^ = /3 3 = j3 4 = 0 (no hay diferencias en la vi¬ 
da útil de los neumáticos promedio verdadera debido a 
las marcas de los neumáticos) contra // a : por lo menos 
una Pj F 0 utilizando una prueba al nivel de 0.05. 

2. Se están considerando cuatro recubrimientos diferentes co¬ 
mo protección contra corrosión de tubería de metal. Ésta se 
enterrará en tres tipos distintos de suelo. Para investigar si 
la cantidad de corrosión depende o del recubrimiento o del 


tipo de suelo, se seleccionan 12 tramos de tubería. Cada tra¬ 
mo se recubre y se entierra en uno de los tres tipos de sue¬ 
lo durante un tiempo fijo, después del cual se determina la 
cantidad de corrosión (profundidad máxima de las picadu¬ 
ras, en 0.0001 pulg) Los datos aparecen en la tabla. 


Recubrimiento (A) 



Tipo de suelo ( B ) 

1 2 3 

1 

64 

49 

50 

2 

53 

51 

48 

3 

47 

45 

50 

4 

51 

43 

52 


a. Suponiendo la validez del modelo aditivo realice el análi¬ 
sis ANOVA por medio de una tabla ANOVA para ver si la 
cantidad de corrosión depende del tipo de recubrimiento 
utilizado o del tipo de suelo. Use a = 0.05. 

b. Calcule p,a l ,oi 1 ,a. i ,oí i ,p l ,p 2 yp y 
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3. El artículo “Adiabatic Humidification of Air with Water in 
a Packed Tower” ( Chem. Eng. Prog., 1952: 362-370) repor¬ 
ta datos sobre coeficiente de transferencia de calor de una 
película de gas (Btu/h pie 2 en °F) como una función del gas¬ 
to de gas (factor A) y gasto de líquido (factor B). 

B 



1(190) 

2(250) 

3(300) 

4(400) 

1(200) 

200 

226 

240 

261 

2(400) 

278 

312 

330 

381 

3(700) 

369 

416 

462 

517 

4(1100) 

500 

575 

645 

733 


a. Después de construir una tabla ANOVA, pruebe al nivel 
0.01 tanto la hipótesis de ningún efecto del gasto de gas 
contra la alternativa apropiada y la hipótesis de ningún 
efecto del gasto de líquido contra la alternativa apropiada. 

b. Use el procedimiento de Tukey para investigar diferen¬ 
cias en el coeficiente de transferencia de calor esperado 
debido a los diferentes gastos de gas. 

c. Repita el inciso b) con gastos de líquido. 

4. En un experimento para ver si la cantidad de cobertura de pin¬ 
tura de látex de color azul claro para interiores depende o de 
la marca de la pintura o de la marca del rodillo utilizado, se 
aplicó un galón de cada una de las cuatro marcas de pintura 
utilizando cada una de tres marcas de rodillo y se obtuvieron 
los siguientes datos (número de pies cuadrados cubiertos). 




Marca de rodillo 

1 2 

3 


1 

454 

446 

451 

Marca de 

2 

446 

444 

447 

pintura 

3 

439 

442 

444 


4 

444 

437 

443 


a. Construya la tabla ANOVA. [Sugerencia'. Los cálculos 
pueden ser expeditados restando 400 (o cualquier otro 
número conveniente) de cada observación. Esto no afec¬ 
ta los resultados finales.] 

b. Formule y pruebe las hipótesis apropiadas para decidir 
si la marca de la pintura tiene algún efecto en la cober¬ 
tura. Use a = 0.05. 

c. Repita el inciso b) para la marca de rodillo. 

d. Use el método de Tukey para identificar diferencias sig¬ 
nificativas entre las marcas. ¿Hay alguna marca que pa¬ 
rezca claramente preferible a las demás? 

5. En un experimento para evaluar el efecto de ángulo de tirón 
de la fuerza requerida para separar conectores eléctricos, se 
utilizaron cuatro ángulos diferentes (factor A) y cada uno de 
una muestra de cinco conectores (factor B) fue jalado una 
vez a cada ángulo (“A Mixed Model Factorial Experiment 
in Testing Electrical Connectors”, Industrial Quality Con¬ 
trol , 1960: 12-16). Los datos aparecen en la tabla adjunta. 

B 



1 

2 

3 

4 

5 

0 o 

45.3 

42.2 

39.6 

36.8 

45.8 

A 2 ° 

44.1 

44.1 

38.4 

38.0 

47.2 

A 4° 

42.7 

42.7 

42.6 

42.2 

48.9 

6 o 

43.5 

45.8 

47.9 

37.9 

56.4 
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¿Sugieren los datos que la fuerza de separación promedio 
verdadera es afectada por el ángulo de tirón? Formule y pruebe 
las hipótesis a un nivel de 0.01 construyendo primero una ta¬ 
bla ANOVA (STC = 396.13, SCA = 58.16 y SCB = 246.97). 

6. Un condado particular emplea tres valuadores que son 
responsables de determinar el valor de las propiedades resi¬ 
denciales en el condado. Para ver si estos valuadores difieren 
sistemáticamente en sus avalúos, se seleccionan 5 casas y a 
cada valuador se le pide que determine el valor de mercado 
de cada casa. Con el factor A denotando valuadores (7 = 3) y 
el factor B denotando casas (7 = 5), suponga SCA = 11.7, 
SCB = 113.5 y SCE = 25.6. 

a. Pruebe H 0 : aq = a 2 = a 3 = 0 al nivel 0.05 (77 0 manifies¬ 
ta que no existen diferencias sistemáticas entre los va¬ 
luadores.) 

b. Explique por qué se utilizó un experimento de bloques 
aleatorizados con sólo 5 casas en lugar de un experimen¬ 
to ANOVA unidireccional que implique un total de 15 
casas diferentes con 5 casas distintas valuadas por cada 
asesor (un grupo diferente de 5 para cada valuador). 

7. El artículo “Rate of Stuttering Adaptation Under Two Elec¬ 
tro-Shock Conditions” (Behavior Research Therapy, 1967, 
49-54) da calificaciones de adaptación de tres tratamientos 
diferentes: 1) ningún choque eléctrico, 2) choque eléctrico 
después de cada palabra tartamudeada y 3) choque eléctri¬ 
co durante cada momento de tartamudeo. Estos tratamien¬ 
tos se utilizaron en cada uno de 18 tartamudos y se obtuvo 
STCr = 3476.00, STCr = 28.78 y SCB1 = 2977.67. 

a. Construya la tabla ANOVA y pruebe a un nivel de 0.05 
para ver si la calificación de adaptación promedio de¬ 
pende del tratamiento dado. 

b. Juzgando por la proporción F de sujetos (factor B ), 
¿piensa que la formación de bloques de sujetos fue efec¬ 
tiva en este experimento? Explique. 

8. El artículo “Exercise Thermoregulation and Hiperprolacti- 
naemia” ( Ergonomics , 2005: 1547-1557) discutió cómo va¬ 
rios aspectos de la capacidad de hacer ejercicio podría 
depender de la temperatura del ambiente. Los datos adjun¬ 
tos sobre pérdida de masa corporal (kg) después de ejerci¬ 
tarse en un ergómetro de ciclos semirrecostado en tres 
temperaturas ambiente diferentes (6 o , 18° y 30°C) fueron 
proporcionados por los autores del artículo. 




Frío 

Neutro 

Caliente 


1 

0.4 

1.2 

1.6 


2 

0.4 

1.5 

1.9 


3 

1.4 

0.8 

1.0 


4 

0.2 

0.4 

0.7 

Sujeto 

5 

1.1 

1.8 

2.4 


6 

1.2 

1.0 

1.6 


7 

0.7 

1.0 

1.4 


8 

0.7 

1.5 

1.3 


9 

0.8 

0.8 

1.1 


a. ¿Afecta la temperatura la pérdida de masa corporal pro¬ 
medio verdadera? Realice una prueba usando un nivel 
de significación de 0.01 (como lo hizo el autor del 
artículo citado). 

b. Investigue las diferencias significativas entre las tempe¬ 
raturas. 
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c. Los residuos son 0.20, 0.30, —0.40, —0.07, 0.30, 0.00, 
0.03, -0.20, -0.14, 0.13, 0.23, -0.27, -0.04, 0.03, 
-0.27, -0.04, 0.33, -0.10, -0.33, -0.53, 0.67, 0.11, 
— 0.33, 0.27, 0.01, —0.13, 0.24. Úselos como base para 
investigar la factibilidad de las suposiciones que funda¬ 
mentan su análisis en a). 

9. El artículo “The Effects of a Pneumatic Stool and a One-Leg- 
ged Stool on Lower Limb Joint Load and Muscular Activity 
During Sitting and Rising” ( Ergonomics , 1993: 519-535) da 
los datos adjuntos sobre el esfuerzo requerido de un sujeto 
para ponerse de pies de cuatro tipos diferentes de bancos (es¬ 
cala de Borg). Realice un análisis de varianza con a = 0.05 
y seguido de un análisis de comparaciones múltiples si es 
apropiado. 



Sujeto 

1 23456789 

x ¡- 

1 

12 10 7789879 

8.56 

Tipo 2 

15 14 14 11 11 11 12 11 13 

12.44 

de 3 

12 13 13 10 8 11 12 8 10 

10.78 

banco ^ 

10 12 9 9 7 10 11 7 8 

9.22 


10. La resistencia de concreto utilizado en construcciones comer¬ 
ciales tiende a variar de un lote a otro. Por consiguiente, se 
“curan” pequeños cilindros de prueba de concreto muestrea- 
do de un lote durante periodos hasta de 28 días en ambientes 
con temperatura y humedad controladas antes de realizar 
mediciones de resistencia. El concreto es entonces “com¬ 
prado y vendido con base en los cilindros para prueba de re¬ 
sistencia” (ASTM C 31 Standard Test Method for Making 
and Curing Concrete Test Specimens in the Field). Se obtu¬ 
vieron los datos adjuntos con un experimento realizado pa¬ 
ra comparar tres métodos de curado diferentes con respecto 
a resistencia a la compresión (MPa). Analice estos datos. 


Lote Método A Método B Método C 


1 

30.7 

33.7 

30.5 

2 

29.1 

30.6 

32.6 

3 

30.0 

32.2 

30.5 

4 

31.9 

34.6 

33.5 

5 

30.5 

33.0 

32.4 

6 

26.9 

29.3 

27.8 

7 

28.2 

28.4 

30.7 

8 

32.4 

32.4 

33.6 

9 

26.6 

29.5 

29.2 

10 

28.6 

29.4 

33.2 


11. Los “residuos” de un ANOVA bifactorial con = 1 son las 
cantidades Xy — (/I + a¡ + fij). Se puede utilizar un diagrama 
de probabilidad normal de estos residuos como verificación de 
factibilidad de la suposición de normalidad. Construya el 
diagrama con los datos del ejemplo 11.1 y comente. 

12. Suponga que en el experimento descrito en el ejercicio 6 las 
cinco casas en realidad se seleccionaron al azar de entre 
aquellas de una cierta edad y tamaño, de modo que el factor B 
es aleatorio y no fijo. Pruebe H 0 : cr| = 0 contra Hy. <x| > 0 
utilizando una prueba con un nivel de 0 . 01 . 

13. a. Demuestre que una constante d puede ser sumada (o res¬ 

tada de) cada Xy sin afectar cualquiera de las sumas de 
los cuadrados ANOVA. 

b. Suponga que cada Xy se multiplica por una constante no 
cero c. ¿Cómo afecta esto las sumas de los cuadrados 
ANOVA? ¿Cómo afecta esto los valores de los estadísti¬ 
cos F a y F g ? ¿Qué efecto tiene la “codificación” de los 
datos mediante y y = cxy + d en las conclusiones que se 
derivan de los procedimientos ANOVA? 

14. Use el hecho de que E(Xj¡) = p, + <*,+ [í¡ con = 2jS• = 0 
para demostrar que E(X¡. — X,_) = a¡, de modo que a¡ = 
X¡. — X.. sea un estimador insesgado para a¡ 

15. Las curvas de potencia de las figuras 10.5 y 10.6 pueden ser 
utilizadas para obtener /3 = P(error de tipo II) para la prueba 
F en ANOVA bifactorial. Con valores fijos de aq, aq, . . . , 
a ; , se calcula la cantidad (j> 2 = {JII)Y.or¡la 2 . Entonces la ci¬ 
fra correspondiente a v¡ = I » 1 se ingresa en el eje hori¬ 
zontal en el valor de <j>, se lee la potencia en el eje vertical de 
la curva marcada v 2 = (/ — 1)(7 — 1) y J8 = 1 — potencia. 

a. En el experimento descrito en el ejercicio 2, determine 
j 8 cuando aq = 4, aq = 0, <*3 = 0 : 4 = —2 y cr = 4. Re¬ 
pita con o¡ = 6 , o 2 = 0, o 3 = o 4 = —3 y <r = 4. 

b. Por simetría, ¿cuál es /I para la prueba H 0B contra H ^ en 
el ejemplo 11.1 cuando = 0.3, jS-, = /3 3 = j3 4 = —0.1 
y a = 0.3? 


| 11.2 ANOVA bifactorial con K¡j > 1 

En la sección 11.1, se analizaron datos derivados de un experimento de dos factores en el cual 
había una observación por cada una de las combinaciones IJ de niveles de los dos factores. 
Para obtener procedimientos de prueba válidos, se supuso que las ¡i jJ tienen una estructura 
aditiva con /x- = ¡x + a ¡ ,4- /3 y , ^a¡ = 2j3 ¡ = 0. Aditividad significa que la diferencia en las 
respuestas promedio verdaderas para dos niveles cualesquiera de los factores es la misma para 
cada nivel del otro factor. Por ejemplo, — ¡jl= (¡i + a¡ + f3j) — (/x + a¡, + /3 ; ) = a¡ — a¡,. 
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independiente del nivel j del segundo factor. Esto se muestra en la figura 11.1a), donde las 
líneas que conectan respuestas promedio verdaderas son paralelas. 

La figura 11.1b) ilustra un conjunto de respuestas promedio verdaderas que no tienen 
estructura aditiva. Las líneas que conectan estas /x- no son paralelas, lo que significa que la 
diferencia en las respuestas promedio verdaderas para distintos niveles de un factor sí de¬ 
penden del nivel del otro factor. Cuando la aditividad no prevalece, se dice que hay interac¬ 
ción entre los diferentes niveles de los factores. La suposición de aditividad permitió en la 
sección 11.1 obtener un estimador de la varianza del error aleatorio cr 2 (MCE) que resultó 
ser insesgado fuera o no verdadera cualquier hipótesis de interés. Cuando K¡j > 1 para por 
lo menos un par (i,j), se puede obtener un estimador válido de cr 2 sin suponer aditividad. Al 
especificar el modelo apropiado y al derivar procedimientos de prueba, se abordará el caso 
Ktj = K > 1, de modo que el número de observaciones por “celda” (por cada combinación 
de niveles) es constante. 

Parámetros e hipótesis para el modelo 
de efectos fijos 

En lugar de utilizar las p (/ como parámetros de modelo, se acostumbra utilizar un conjunto 
equivalente que revela con más claridad el rol de interacción. Sean 




AL. = 7 2>y- 
J j 


a 7 = yl>y 


(11.7) 


Por consiguiente ¡i es la respuesta esperada promedio a todos los niveles de ambos factores 
(la gran media verdadera), ¡j,¡ es la respuesta esperada promediada a todos los niveles del se¬ 
gundo factor cuando el primer factor A se mantiene en el nivel i y asimismo para /x ■. 


a¡ = ¡i¡. - ¡x = efecto del factor A al nivel i 
/ 3j = /i , — fi = efecto del factor B al nivel j 

_ _ interacción entre el factor A al 

y¡¡ P ¡¡ P a , Pj n ivel i y el factor B al nivel j 

de donde 

Py = P + «; + Pj + Jij 


( 11 . 8 ) 


(11.9) 



El modelo es aditivo si y sólo si todas las y- = 0. Las y- se conocen como parámetros de 
interacción. Las a¡ se llaman efectos principales para el factor A y las ¡3 ■ son los efectos 
principales para el factor B. Aunque existen I a¡, J ¡3 i e IJ y- además de /x, las condicio¬ 
nes 2 a¡ = 0, Yjfij = 0, X ; y I( = 0 con cualquier i y 2 ; y- = 0 cualquier j [todas en virtud de 
(11.7) y (11.8)] implican que sólo IJ de estos nuevos parámetros están independientemente 
determinados: /x, I — 1 de las cq, / — 1 de las /3 ; e (/ — I )(J — 1) de las y-. 

Ahora hay tres conjuntos de hipótesis que se considerarán: 


77o AB- Jij 

= 0 para todas las i, j 

contra 

77 d AB- 

por lo menos una y ¡j A 0 

Hqa : a \ 

= ■ ■ ■ = a¡ = 0 

contra 

77 a 

por lo menos una a, A 0 

77q b- Pi 

= ‘ ’ ■ = Pj = 0 

contra 

T7 aB : 

por lo menos una )L A 0 
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Normalmente primero se prueba la hipótesis de no interacción H 0AB . Si H 0AB no es recha¬ 
zada, entonces se prueban las otras dos hipótesis para ver si los efectos principales son sig¬ 
nificativos. Si H oab es rechazada y H 0A se prueba y no es rechazada, el modelo resultante 
¡i- = ¡jl + ¡3j + y¡j no se presta para la interpretación directa. En ese caso, es mejor cons¬ 
truir una figura similar a la figura 11.1b) para tratar de visualizar una forma en la cual inte¬ 
ractúan los factores. 

El modelo y los procedimientos de prueba 

Ahora se utilizan subíndices triples tanto para variables aleatorias como para valores obser¬ 
vados, con X i]k y x¡j k refiriéndose a la Pésima observación (replicación) cuando el factor A 
está al nivel i y el B al factor j. El modelo es entonces 


x ¡jk - v + a i + Pj + y¡j + € ¡jk (ií.io) 

i = 1_,/, k = 1,. .., K 

donde las e j] son independientes y normalmente distribuidas, cada una con media 0 y 
varianza cr 2 . 



De nueva cuenta un punto en lugar de un subíndice denota suma de todos los valores 
del subíndice y una raya horizontal indica promedio. Por consiguiente, X tj es el total de to¬ 
das las K observaciones realizadas para el factor A al nivel i y el factor B al nivel j [todas las 
observaciones en las celdas (i, j)] y X-., es el promedio de estas K observaciones. 

Para probar las hipótesis de interés, de nuevo se emplean sumas de cuadrados. 



DEFINICIÓN 


STC =XIX(^ 

i j k 

SCE = 2 21 (X ijk 
i j k 

- X..) 2 

gl = IJK - 1 

- Xij) 1 

gl = IJ{K- 1) 

sca = xx2&. 

i j k 

- X...Y 

gl = / - 1 

scb = 22X(z,. 

i j k 

- X...) 2 

CTQ^ 

II 

1 

SCAB 

i j k 

- X,. - X.j. + X..) 2 

gl = (/ - l)(i- O 


La identidad fundamental es 

STC = SC A + SCB + SCAB + SCE 
SCAB se conoce como interacción de las sumas de cuadrados. 


La variación total se divide por consiguiente en cuatro partes; no explicada (SCE, la cual 
estaría presente si o no cualquiera de las tres hipótesis nula era verdadera) y en tres partes 
que pueden ser explicadas por la verdad o falsedad de las tres H 0 . Cada uno de los cuatro 
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cuadrados de la media se define como MC = SC/gl. Los cuadrados de la media esperados 
sugieren que cada conjunto de hipótesis deberá ser probado utilizando la proporción apro¬ 
piada de cuadrados de la media con MCE en el denominador: 

£(MCE) = o- 2 

TK I 

£(MCA) = o- 2 + - X a 2 

I 1 ,=i 

£(MCB) = o- 2 + —X ]3 2 
J 1 j= i 

E (MCAB) = ^+ (/ _,* _ n iiü 

Se puede demostrar que cada una de las tres proporciones de cuadrados de la media tiene 
una distribución F cuando la //„ apropiada es verdadera, lo cual da los siguientes procedimien¬ 
tos de prueba a nivel a. 



Hipótesis 


Valor estadístico de prueba 

Región de rechazo 

H 0A 

contra 

h íiA 

MCA 

ÍA MCE 

f A — 

Hqb 

contra 

H. áB 

_ MCB 
’ B MCE 

Íb — Fa,J-lJJ(K- 1 ) 

Hqab 

contra 

H ñ AB 

_ MCAB 

AB MCE 

ÍXB ~ (/—!)(/— 1),1J(K~ 1 ) 


Ejemplo 11.7 Se está considerando plantar tres variedades diferentes de jitomates (Harvester, Posa Early 
Dwarf e Ife Núm. 1) y cuatro densidades de plantas distintas (10, 20, 30 y 40 mil plantas 
por hectárea) en una región particular. Para ver si la variedad o la densidad de plantación 
afecta la cosecha, se utiliza cada combinación de variedad y densidad de plantación en tres 
parcelas diferentes y las cosechas obtenidas aparecen en la tabla 11.6 (con base en el artículo 
“Effects of Plant Density on Tomato Yields in Western Nigeria”, Experimental Agriculture, 
1976: 43-47). 


Tabla 11.6 Datos de cosecha del ejemplo 11.7 


Variedad 


10000 

Densidad de plantación 

20000 30000 

40000 

x ¡- 

X ¡- 

H 

10.5 

9.2 7.9 

12.8 11.2 13.3 

12.1 12.6 14.0 

10.8 9.1 12.5 

136.0 

11.33 

Ife 

8.1 

8.6 10.1 

12.7 13.7 11.5 

14.4 15.4 13.7 

11.3 12.5 14.5 

146.5 

12.21 

P 

16.1 

15.3 17.5 

16.6 19.2 18.5 

20.8 18.0 21.0 

18.4 18.9 17.2 

217.5 

18.13 

X -j- 


103.3 

129.5 

142.0 

125.2 

500.00 


X T 


11.48 

14.39 

15.78 

13.91 


13.89 


En este caso, I=3,J = 4yK=3, para un total de IJK = 36 observaciones. Como antes, 
los resultados del análisis se resumen en una tabla ANOVA (tabla 11.7). 
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Tabla 11.7 Tabla ANOVA para el ejemplo 11.7 


Origen de 
la variación 

gl 

Suma de cuadrados 

Cuadrado de la media 

/ 

Variedades 

2 

327.60 

163.8 

f A = 103.02 

Densidad 

3 

86.69 

28.9 

f B = 18.18 

Interacción 

6 

8.03 

1.34 

Íab = 0-84 

Error 

24 

38.04 

1.59 


Total 

35 

460.36 




Como F 001624 = 3.67 y f AB = 0.84 no es > 3.67, H QAB no puede ser rechazada al nivel 0.01, 
de ahí que se concluye que los efectos de interacción no son significativos. Ahora la presen¬ 
cia o ausencia de efectos principales pueden ser investigadas. Como í ’ 001224 = 5.61 y 
f A = 103.02 > 5.61, H oa es rechazada al nivel 0.01 a favor de la conclusión de que las dife¬ 
rentes variedades no afectan las cosechas promedio verdaderas. Asimismo, f B = 18.18 > 
4.72 = Fq oí 3 24 s así que se concluye que la cosecha promedio verdadera también depende 
de la densidad de plantación. 

La figura 11.5 muestra el diagrama de interacción. Se observan las líneas casi parale¬ 
las de las tres variedades de jitomate, en concordancia con la prueba F que no muestra una 
interacción significativa. La cosecha de Pusa Early Dwarf parece estar significativamente 
por encima de las cosechas de las otras dos variedades y esto concuerda con la F altamen¬ 
te significativa asociada con las variedades. Además, las tres variedades muestran el mismo 
patrón en el cual la cosecha se incrementa conforme la densidad también lo hace, pero dis¬ 
minuye más allá de 30 000 por hectárea. Esto sugiere que si se siembran más semillas se in¬ 
crementará la cosecha pero a la larga la sobrepoblación hace que se reduzca la cosecha. 

En este ejemplo uno de los factores es cuantitativo y éste es naturalmente el factor uti¬ 
lizado como eje horizontal en el diagrama de interacción. En el caso en que ambos factores 
son cuantitativos, la selección del eje horizontal sería arbitraria, pero se da el caso de dos 
diagramas tratados de la misma manera. En realidad, MINITAB dispone de una opción que 
permite incluir ambos diagramas en la misma gráfica. 


Variedad 

—a— H - * - Ife P 



Densidad 

Figura 11.5 Diagrama de interacción de MINITAB para los datos de la cosecha de jitomate. 

Para verificar la factibilidad de las suposiciones de normalidad y varianza constante 
se pueden construir diagramas similares a aquellos de la sección 11.1. Defínanse los valo¬ 
res pronosticados (valores ajustados) como las medias de celdas x ijk = x tj , así que los resi¬ 
duos, las diferencias entre las observaciones y los valores pronosticados, son x ljk — x :j . El 
diagrama normal de los residuos es la figura 11 . 6 a) y el diagrama de los residuos contra los 
valores ajustados es la figura 11, 6 b). El diagrama normal es suficientemente recto por lo que 
no hay que preocuparse por la suposición de normalidad. El diagrama de residuos contra los 
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valores ajustados tiene una dispersión bastante uniforme vertical, así que no hay por qué 
preocuparse sobre la suposición de varianza constante. 



Figura 11.6 Diagramas obtenidos con MINITAB para verificar las suposiciones para el ejemplo 11.7. 



Comparaciones múltiples 

Cuando la hipótesis de no interacción H 0AB no es rechazada y por lo menos una de las dos 
hipótesis nulas de efecto principal es rechazada, se puede utilizar el método de Tukey para 
identificar diferencias significativas en los niveles. Para identificar diferencias entre las a¡ 
cuando H 0A es rechazada, 

1. Se obtiene Q aI jji K -i)i donde el segundo subíndice 1 identifica el número de niveles que 
se están comparando y el tercero se refiere al número de grados de libertad en cuanto al 
error. 

2. Se calcula w = QyMCEKJK), donde JK es el número de observaciones promediadas 
para obtener cada una de las x¡,, en el paso 3. 

3. Se ordenan las x¡„ desde la más pequeña hasta la más grande, se subrayan todos los pa¬ 
res que difieren por menos de w. Los pares no subrayados corresponden a niveles del fac¬ 
tor A significativamente diferentes. 

Para identificar niveles diferentes del factor B cuando H 0B es rechazada, se reemplaza el se¬ 
gundo subíndice en Q por./, se reemplaza JK por IK en w, y se reemplaza 5 ; .. por 5.:.. 

Ejemplo 11.8 Para el factor A (variedades), 1=3, así que a = 0.01 e IJ(K — 1) = 24, <2ooi3 24 = 4.55. 

(continuación Entonces w = 4.55V 1.59/12 = 1.66, así que después de ordenar y subrayar se obtiene 

del ejemplo _ 

n.7) Xl ~ X2 - X3 - 

11.33 12.21 18.13 

Las variedades Harvester e Ife no parecen diferir significativamente una de otra en cuanto a 
algún efecto en la cosecha promedio verdadera, pero ambas difieren de la variedad Pusa. 
Para el factor B (densidad), J = 4 así que <2o or 4 24 = 4-91 y w = 4.91 V 1.59/9 = 2.06. 

3t.i. 5 . 4 . 5.2. x. 3 . 

11.48 13.91 14.39 15.78 
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Por lo tanto, con un coeficiente de error experimental de 0.01, el cual es bastante conserva¬ 
dor, sólo la densidad más baja parece diferir de manera significativa de todas las demás. In¬ 
cluso con a = 0.05 (de modo que w = 1.64), las densidades 2 y 3 no pueden ser juzgadas 
significativamente diferentes una de otra en cuanto a su efecto en la cosecha. ■ 


Modelos con efectos combinados y aleatorios 

En algunos problemas, es posible que los niveles de uno u otro factor hayan sido seleccio¬ 
nados de una gran población de niveles posibles, así que los efectos contribuidos por el fac¬ 
tor son aleatorios en lugar de fijos. Como en la sección 11.1, si ambos factores contribuyen 
con efectos aleatorios, el modelo se conoce como modelo de efectos aleatorios, en tanto que 
si un factor es fijo y el otro aleatorio, resulta un modelo de efectos combinados. Ahora se 
considerará el análisis de un modelo de efectos combinados en el cual el factor A (filas) es 
el factor fijo y el factor B (columnas) es el factor aleatorio. El caso en el cual ambos facto¬ 
res son aleatorios se aborda en el ejercicio 26. 


DEFINICIÓN 


El modelo de efectos combinados cuando el factor A es fijo y el B es aleatorio es 

x ijk = B + a i + B j + G ij + € ¡jk 

i = 1, . . . ,/, 7=1 _,/, k = 1, . . . ,K 


Aquí ¡i y a¡ son constantes con ^a¡ = 0 y las Bj, G¡j y e !]k son variables aleatorias inde¬ 
pendientes normalmente distribuidas con valor esperado 0 y varianzas cr|, cr 2 G y cr 2 , respec¬ 
tivamente.* 




H (m : 

“l = “2 = • 

• = a¡ = 0 contra 

H.a- 

por lo menos una a i A 0 

Hqb- 

0-1 = 0 

contra 

H . dB : 

o - 2 >0 

Hqg- 

O 

II 

NÜ 

b 

contra 

H.g- 

O 

A 

<nO 

b 


Se acostumbra probar H 0A y H 0B sólo si la hipótesis de no interacción H oc no puede ser 
rechazada. 

Las sumas pertinentes de cuadrados y cuadrados de la media requeridas para los pro¬ 
cedimientos de prueba se definen y calculan con exactitud como en el caso de efectos fijos. 
Los cuadrados de la media esperados para el modelo fijo son 

E(MCE) = o - 2 
E(MCA) = a 2 + Kct 2 g + 

£(MCB) = o - 2 + Ko-% + IKa 2 


y 


£(MCAB) = o - 2 + Ka 2 G 


Por consiguiente, para probar la hipótesis de no intervención la razón f AB = MCAB/MCE 
es de nuevo apropiada, con H oc rechazada si f AB > F a {I _ í)( / UUtK , t . Sin embargo, para pro¬ 
bar H oa contra H íA , los cuadrados de la media esperados sugieren que aunque el numerador 
de la razón F deberá seguir siendo MCA, el denominador deberá ser MCAB en lugar de 
MCE. MCAB también es el denominador de la razón F para probar H w . 


Esto se conoce como modelo “no restringido”. Un modelo “restringido” alternativo requiere X.U.y = 0 por cada 
j (de ahí que las (7 ya no son independientes). Los cuadrados de la media esperados y las razones F apropiadas 
para probar ciertas hipótesis dependen de la selección del modelo. La opción preestablecida de MINITAB pro¬ 
duce resultados para el modelo no restringido. 
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Ejemplo 11.9 


e 



11.2 ANOVA bifactorial con Kj> 1 417 


Para probar H 0A contra 77, Ll (los factores A fijo, B aleatorio) el valor del estadístico de 
prueba es f A = MCA/MCAB y la región de rechazo es f A > F a ¡ , (/ 1)(7 _ lr La prueba 
de H ob contra fl i[B utiliza f B = MCB/MCAB y la región de rechazo es f B > 
FaJ-UI- 1X7-1)- 


Un ingeniero de procesos ha identificado dos causas potenciales de vibración de motores eléc¬ 
tricos, el material utilizado para la carcasa del motor (factor A) y el proveedor de cojinetes uti¬ 
lizados en el motor (factor B). Los datos adjuntos sobre la cantidad de vibración (micrones) se 
obtuvieron con un experimento en el cual se construyeron motores con carcasas de acero, alu¬ 
minio y plástico y cojinetes suministrados por cinco proveedores seleccionados al azar. 





Proveedor 



1 

2 

3 

4 

5 


Acero 

13.1 13.2 

16.3 15.8 

13.7 14.3 

15.7 15.8 

13.5 12.5 

Material 

Aluminio 

15.0 14.8 

15.7 16.4 

13.9 14.3 

13.7 14.2 

13.4 13.8 


Plástico 

14.0 14.3 

17.2 16.7 

12.4 12.3 

14.4 13.9 

13.2 13.1 


Sólo los tres materiales para carcasas utilizados en el experimento se están considerando pa¬ 
ra usarse en la producción, de ahí que el factor A es fijo. Sin embargo, los cinco proveedo¬ 
res fueron seleccionados al azar de una población mucho más grande, de modo que el factor 
B es aleatorio. Las hipótesis nulas pertinentes son 

Hqa- a i ~ a i ~~ a 3 — 0 H ob . a\ — 0 H oab . erg — 0 

En la figura 11.7 aparecen los resultados generados por MINITAB. La columna de valor P 
en la tabla ANOVA indica que las últimas dos hipótesis nulas deberán ser rechazadas a un 
nivel de significación de 0.05. Los diferentes materiales para carcasas por sí mismos no pa¬ 
recen afectar la vibración, pero la interacción entre el material y el proveedor es una causa 
significativa de la variación de la vibración. 



Factor 

Type 

Levels 

Valúes 





casmater 

f ixed 

3 

1 

2 

3 



source 

random 

5 

1 

2 

3 4 

5 


Source 


DF 

SS 


MS 

F 

P 

casmater 


2 

0.7047 


0.3523 

0.24 

0.790 

source 


4 

36.6747 


9.1687 

6.32 

0.013 

casmater* 

source 

8 

11.6053 


1.4507 

13.03 

0.000 

Error 


15 

1.6700 


0.1113 



Total 


29 

50.6547 





Source 


Variance Error 

Expected Mean Square for Each Term 



component term 

(using unrestricted model) 


1 casmater 


3 

(4) 

+ 2 (3) + Q [1] 



2 source 


1.2863 3 

(4) 

+ 2(3) + 6(2) 



3 casmater*source 

0.6697 4 

(4) 

+ 2 (3) 



4 Error 


0.1113 

(4) 





Figura 11.7 Resultados obtenidos con la opción "balanced ANOVA" de MINITAB con 

los datos del ejemplo 11.9. ■ 

Cuando por lo menos dos de las K- son desiguales, los cálculos ANOVA son mucho 
más complejos que en el caso K¡- = K, y existe controversia en cuanto a cuáles procedimien¬ 
tos de prueba deben ser utilizados. Una de las referencias del capítulo puede ser consultada 
para más información. 
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EJERCICIOS Sección 11.2 (16-26) 


16. En un experimento para valuar los efectos de tiempo de fragua¬ 
do (factor A) y tipo de mezcla (factor B ) en la resistencia a la 
compresión de cubos de cemento endurecido, se utilizaron tres 
tiempos de fraguado diferentes en combinación con cuatro 
mezclas distintas, con tres observaciones obtenidas para cada 
una de las 12 combinaciones de mezcla-tiempo de fraguado. 
Las sumas de cuadrados resultantes fueron SCA = 30763.0, 
SCB = 34 185.6, SCE = 97436.8 y STC = 205966.6. 

a. Construya una tabla ANOVA. 

b. Pruebe al nivel 0.05 la hipótesis nula H ÜAB . todas las 
y¡j = 0 (ninguna interacción de factores) contra // aAB : 
por lo menos una y- A 0 . 

c. Pruebe al nivel 0.05 la hipótesis nula H 0A . a 1 = a 2 = a 3 
= 0 (efectos principales del factor A ausentes) contra 
H^: por lo menos una a¡ A 0 . 

d. Pruebe H 0B : f3 l = j3 2 = /3 3 = /3 4 = 0 contra H^: por lo 
menos una / 3j A 0 utilizando una prueba al nivel 0.05. 

e. Los valores de x,„ fueron i¡„ = 4010.88, x 2 .. = 4029.10 
y jt 3 ..= 3960.02. Use el procedimiento de Tukey para in¬ 
vestigar diferencias significativas entre los tres tiempos 
de fraguado. 

17. El artículo “Towards Improving the Properties of Plaster 
Moulds and Castings” ( J. of Engr. Manuf., 1991: 265-269) 
describe varios ANOVA realizados para estudiar cómo la 
cantidad de fibra de carbono y las adiciones de arena afec¬ 
tan las diversas características del proceso de moldeo. 
A continuación se dan datos sobre dureza de la pieza mol¬ 
deada y resistencia del molde húmedo. 


Adición 
de arena 

(%) 

Adición 

de fibra 
de carbono 

(%) 

Dureza 
de la pieza 
fundida 

Resistencia 
de molde 

húmedo 

0 

0 

61.0 

34.0 

0 

0 

63.0 

16.0 

15 

0 

67.0 

36.0 

15 

0 

69.0 

19.0 

30 

0 

65.0 

28.0 

30 

0 

74.0 

17.0 

0 

0.25 

69.0 

49.0 

0 

0.25 

69.0 

48.0 

15 

0.25 

69.0 

43.0 

15 

0.25 

74.0 

29.0 

30 

0.25 

74.0 

31.0 

30 

0.25 

72.0 

24.0 

0 

0.50 

67.0 

55.0 

0 

0.50 

69.0 

60.0 

15 

0.50 

69.0 

45.0 

15 

0.50 

74.0 

43.0 

30 

0.50 

74.0 

22.0 

30 

0.50 

74.0 

48.0 


a. Un ANOVA para la resistencia del molde húmedo da SC- 
Arena = 705, SCFibra = 1278, SCE = 843 y STC = 3105. 
Pruebe en busca de cualesquiera otros efectos con a = 0.05. 


b. Realice un ANOVA de las observaciones de dureza de la 
pieza moldeada con a = 0.05. 

c. Trace una gráfica de la dureza media muestral con el por¬ 
centaje de arena con niveles diferentes de fibra de carbono. 
¿Es el diagrama consistente con su análisis en el inciso b)? 

18. Los datos adjuntos se obtuvieron con un experimento pa¬ 
ra investigar si el rendimiento con cierto proceso químico 
dependía de la formulación de una mezcla de entrada par¬ 
ticular o de la velocidad del mezclador. 


Velocidad 



60 

70 

80 


189.7 

185.1 

189.0 

1 

188.6 

179.4 

193.0 

Formulación 

190.1 

177.3 

191.1 


165.1 

161.7 

163.3 

2 

165.9 

159.8 

166.6 


167.6 

161.6 

170.3 


Un programa estadístico dio SC(Forma) = 2253.44, 
SC(Velocidad) = 230.81, SC(Forma*Velocidad) = 18.58 y 
SCE = 71.87. 

a. ¿Parece haber interacción entre los factores? 

b. ¿Parece que el rendimiento depende de la formulación o 
la velocidad? 

c. Estime los efectos principales. 

d. Los valores ajustados son x ¡jk = p, + a¡ + + y¡j y los 

residuos son x¡¡ k — x ijk . Verifique que los residuos sean 
0.23, -0.87, 0.63, 4.50, -1.20, -3.30, -2.03, 1.97, 0.07, 
-1.10, -0.30,1.40, 0.67, -1.23,0.57, -3.43, -0.13 y 3.57. 

e. Construya un diagrama de probabilidad normal con los 
residuos dados en el inciso d). ¿Parecen estar normal¬ 
mente distribuidas las e¡j k l 

19. La tabla de datos adjuntos da observaciones sobre acidez to¬ 
tal de muestras de carbón de tres tipos diferentes, con las de¬ 
terminaciones obtenidas con tres concentraciones distintas 
de NaOH etanólico (“Chemistry of Brown Coals”, Austra- 
lian J. Applied Science. 1958: 375-379). 

Tipo de carbón 



Morwell 

Yallourn 

Maddingley 

Conc. de 
NaOH 

0.404N 

8.27, 8.17 

8 . 66 , 8.61 

8.14, 7.96 

0.626N 

8.03, 8.21 

8.42, 8.58 

8.02, 7.89 

0.786N 

8.60, 8.20 

8.61, 8.76 

8.13, 8.07 


a. Suponiendo que ambos efectos son fijos, construya una 
tabla ANOVA, pruebe en cuanto a la presencia de inte¬ 
racción y luego en cuanto a la presencia de efectos prin¬ 
cipales por cada factor (todo a un nivel de 0 . 01 ). 

b. Use un procedimiento de Tukey para identificar diferen¬ 
cias significativas entre los tipos de carbón. 
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20. Se midió la corriente (en pA) necesaria para producir un 
cierto nivel de brillo en un tubo de televisión para dos tipos 
diferentes de vidrio y tres tipos distintos de fósforo y se ob¬ 
tuvieron los datos adjuntos (“Fundamentáis of Analysis of 
Variance”, Industrial Quality Control, 1956: 5-8). 


Tipo de fósforo 





1 

2 

3 

Tipo de 

1 

280, 

290, 285 

300,310, 295 

270, 285, 290 

vidrio 

2 

230, 

235, 240 

260, 240, 235 

220, 225, 230 


Suponiendo que ambos factores son fijos, pruebe H 0AB contra 
H al nivel 0.01. Entonces si H 0AB no puede ser rechazada, 
pruebe los dos conjuntos de hipótesis de efecto principal. 

21. En un experimento para investigar el efecto del “factor ce¬ 
mento” (número de sacos de cemento por yarda cúbica) en 
la resistencia a la flexión del concreto resultante (“Studies of 
Flexural Strength of Concrete, Part 3: Effects of Variation in 
Testing Procedure”, Proceedings ASTM, 1957: 1127-1139), 
se utilizaron 1 = 3 valores de factor diferentes, se selecciona¬ 
ron 7 = 5 lotes distintos de cemento y se vaciaron K = 2 vi¬ 
gas con cada combinación de factor cemento/lote. Las sumas 
de cuadrados incluyen SCA = 22941.80, SCB = 22765.53, 
SCE = 15253.50 y STC = 64954.70. Construya la tabla 
ANOVA. Entonces suponiendo un modelo combinado con 
factor de cemento (A) fijo y lotes (B) aleatorios, pruebe los 
tres pares de hipótesis de interés al nivel 0.05. 

22. Se realizó un estudio para comparar las vidas útiles de es¬ 
critura de cuatro marcas premium de plumas. Se pensaba 
que la superficie de escritura podría afectar la vida útil, así que 
se seleccionaron al azar tres superficies diferentes. Se utili¬ 
zó una máquina de escritura para que las condiciones per¬ 
manecieran homogéneas (p. ej., presión constante y un 
ángulo fijo). La tabla adjunta muestra las dos vidas útiles 
(min) obtenidas con cada combinación de marca-superficie. 

Superficie de escritura 



1 

2 

3 


1 

709, 659 

713, 726 

660, 645 

4112 

Marca 2 

668 , 685 

722, 740 

692, 720 

4227 

de pluma 3 

659, 685 

666 , 684 

678, 750 

4122 

4 

698, 650 

704, 666 

686 , 733 

4137 

*■]■ 

5413 

5621 

5564 

16598 


11.3 ANOVA con tres factores 419 

Realice un ANOVA apropiado y exprese su conclusión. 

23. Los datos adjuntos se obtuvieron en un experimento para in¬ 
vestigar si la resistencia a la compresión de cilindros de con¬ 
creto depende del tipo de material de remate utilizado o de la 
variabilidad de los diferentes lotes (“The Effect of Type of 
Capping Material on the Compressive Strength of Concrete 
Cylinders”, Proceedings ASTM, 1958: 1166-1186). Cada nú¬ 
mero es un total de celda (x¡j) basado en K = 3 observaciones. 

Lote 



1 

2 

3 

4 

5 

1 

1847 

1942 

1935 

1891 

1795 

Material de remate 2 

1779 

1850 

1795 

1785 

1626 

3 

1806 

1892 

1889 

1891 

1756 


Además de YYYr L = 16815 853 y = 50443409. 
Obtenga la tabla ANOVA y luego pruebe al nivel 0.01 las 
hipótesis H oa contra í/ aG , H 0A contra H ^ y H 0B contra H aB , 
suponiendo que el remate es un efecto fijo y los lotes son un 
efecto aleatorio. 

24. a. Demuestre que E(X¡„ — A - ...) = a¡ de modo que X¡„ — A - ... 

sea un estimador insesgado de a¡ (en el modelo de efec¬ 
tos fijos). 

b. Con y¡j = — X¡__ — AL + X___, demuestre que y- es 

un estimador insesgado de y- (en el modelo de efectos 
fijos). 

25. Demuestre cómo se puede obtener un intervalo de confian¬ 
za t de 100(1 — a)% para a¡ — a¡. Luego calcule un inter¬ 
valo de 95% para a 2 — a 3 con los datos del ejercicio 19. 
[Sugerencia: Con 9 = a 2 — 0 : 3 , el resultado del ejercicio 
24a indica cómo obtener 6. Enseguid a calcu le V(6) y <x¿¡ y 
obtenga una estimación de con VMCE para estimar a 
(la cual identifica el número de grados de libertad apropiado).] 

26. Cuando ambos factores son aleatorios en un experimento 
ANOVA bidireccional con K réplicas por cada combinación 
de niveles de factor, los cuadrados de la media esperados 
£(MGE) = <r\ E(MCA) = a 2 + Kcr 2 + JK<r¡, £(MCB) = 
o 2 + K<r¡. + IK<j 2 y £(MCAB) = o 2 + Kcr 2 . 

a. ¿Qué razón F es apropiada para probar H oc : cr G = 0 
contra H. [C : <r}. > 0 ? 

b. Responda el inciso a) para probar H 0A : cr A = 0 contra 

h ,a'- a A > 0 Y h ob : = 0 contra °Í > °- 


| 11.3 ANOVA con tres factores 

Para indicar la naturaleza de los modelos y análisis cuando los experimentos ANOVA im¬ 
plican más de dos factores, aquí se abordará el caso de tres factores fijos: A, B y C. Los 
números de niveles de los tres factores se denotarán por I, J y K, respectivamente y L¡j k = 
el número de observaciones realizadas con el factor A al nivel i, el factor B al nivel j y el 
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factor C al nivel k. Como con el ANOVA bifactorial, el análisis es bastante complicado 
cuando las L ijk no son iguales, por lo que se hace L tjk = L. En ese caso X ¡jkl y x ljkl denotan 
el valor observado, antes y después de que se realiza el experimento de la /-ésima réplica 
(/ = 1 , 2 , . . . , L) cuando los tres factores están fijos en los niveles i,j y k. 

Para entender los parámetros que aparecerán en el modelo ANOVA trifactorial, prime¬ 
ro recuérdese que en el ANOVA bifactorial con réplicas, E(X¡j k ) = ¡jl- = ¡jl + a¡ + + y-, 

donde las restricciones 7 ,«, = Yjfij = 0 , Z;Y¡, = 0 por cada j y 7 ; y y - = 0 por cada i eran ne¬ 
cesarias para obtener un conjunto único de parámetros. Si se utilizan subíndices puntuales 
en las /jl¡j para denotar el cálculo de promedios (en lugar de suma), entonces 


Bi- - B- = - JjYZnij = 

J i u i j 


es el efecto del factor A al nivel i promediado a todos los niveles del factor B, mientras que 


By ~ B.j = By ~ 7 2X = + lij 

1 i 

es el efecto del factor A al nivel i específico del factor B al nivel j. Si el efecto de A al nivel i 
depende del nivel de B, entonces existe interacción entre los factores y las y- no son cero. 
En particular, 



By “ B.j ~ Bi- + B■■ = y¡j (ii-ii) 

Modelo de efectos fijos con tres factores 


DEFINICIÓN 


El modelo para ANOVA con tres factores con L ijk = Les 

x ijki = Bijk + e ¡jki i = 1, • • • . I y=l,...,/ (11.12) 

k=l,...,K, 1= 1, . . . ,L 

donde las e l]kl están normalmente distribuidas con media 0 y varianza cr 2 y 

Bijk = B + <Xi + Pj + 8 k + yf + yf + yf + y iJk (11.13) 



Las restricciones necesarias para obtener parámetros singularmente definidos son que la su¬ 
ma para cualquier subíndice de cualquier parámetro a la derecha de (11.13) sea igual a cero. 

Los parámetros yjfí y A ik y y B ]k se llaman interacciones de dos factores y y ¡jk se llama 
interacción de tres factores; las a¡, ¡3 • y 8 k son los parámetros de los efectos principales. 
A cualquier nivel fijo k del tercer factor, análogo a (11.11), 

Bijk ~ Bi-k ~ B-jk + B-k = yf + y¡jk 

es la interacción del i-ésimo nivel de A con el /-ésimo nivel de B específico del f'-ésimo 
nivel de C, mientras que 

Bij- ~ B¡- ~ B.j. + B— = yf 

es la interacción entre A al nivel i y B al nivel j promediada a todos los niveles de C. Si la 
interacción de A al nivel i y B al nivel j no depende de k, entonces todas las y ijk son iguales 
a 0. Por tanto las y ljk representan no aditividad de las y'j® para dos factores a los varios ni¬ 
veles del tercer factor C. Si el experimento incluyó más de tres factores, habría términos de 



















cll_p397-445.qxd 


3/12/08 


4:27 AM Page 421 


DEFINICIÓN 


e 



11.3 ANOVA con tres factores 421 

interacción de mayor grado correspondientes con interpretaciones análogas. Obsérvese que 
en el argumento previo, si se hubiera considerado fijar el nivel de A o B (en lugar del de C, 
como se hizo) y examinando las y¡j k su interpretación sería la misma, si cualquiera de las in¬ 
teracciones de dos factores dependen del nivel del tercer factor, entonces hay y l]k no cero. 

Análisis de un experimento con tres factores 

Cuando L > 1, existe una suma de cuadrados por cada efecto principal, por cada interac¬ 
ción de dos factores y por la interacción de tres factores. Para escribir éstas en una forma 
que indique cómo se definen las sumas de cuadrados cuando existen más de tres factores, 
obsérvese que cualquiera de los parámetros de modelo en (11.13) puede ser estimado inses¬ 
gadamente promediando X l¡kl para los subíndices apropiados y considerando las diferencias. 
Por lo tanto 

A = X... = %... - X... J A '¡ =_Xj..- x,.. X,.. + .Y.... 

% = X iJk . - X;.. - x, k . - x. k . + X,.. + X. . + X, - X.... 
con los demás efectos principales y estimadores de interacción obtenidos por simetría. 


Las sumas de cuadrados pertinentes son, 


STC = lHl(X kl - X ....) 2 
i j k l 


SC A 
SCAB 


SCABC 

SCE 


= lilla 2 = JKLZiX ,,.. - X ....) 2 

i j k l i 

= llll{yf ) 2 

¡ j k i 

= Kiyy.iX;. - x,.. - x,..+x ....) 2 

= 1111%=iyyy % 

i j k l i j k 

=llll(x ijkl - x i]k ;f 

i j k l 


gl = IJKL - 1 
gl = / - 1 
gl = (/ - 1) (J~ 1) 

gl = (/ - O (J ~ 1 )(X - 1) 
gl = IJK{L - 1) 


con los demás efectos principales y las sumas de cuadrados de interacción de dos fac¬ 
tores obtenidos por simetría. STC es la suma de las otras ocho sumas de cuadrados. 



Cada suma de cuadrados (excepto STC) cuando se divide entre sus grados de libertad 
da un cuadrado de la media. Los cuadrados de la media esperados son 


£(MCE) = o - 2 

e(mca) = o- 2 + 

I 1 i 

E( MCAB) = o - 2 + -—- YZ(y jf) 2 

(/- 1 )(/- í)¡j Y,J 

£ (MCABC) - ^ + 

con expresiones similares de los demás cuadrados de la media esperados. El efecto princi¬ 
pal y las hipótesis de interacción se prueban formando razones F con MCE en cada deno¬ 
minador. 
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Hipótesis nula 

Valor estadístico de prueba 

Región de rechazo 

H oa : todas las a¡ = 0 

MCA 
^ “ MCE 

Ía — F a ,I-l,IJK{L-l) 

H 0 A b- todas las yj? = 0 

MCAB 

Íab ~ MCE 

■Íab — F í *,(/-i)(y-i),/y/i - (L-i ) 

h oabc- todas las Jijk = o 

MCABC 

Íabc ~ MCE 

Íabc — ^ 7 a,(/-i)y-i)(ír-i),/7A:(¿-i) 



Normalmente las hipótesis de efecto principal se prueban sólo si todas las interacciones no 
son significativas. 

Este análisis supone que L ijk = L > 1. SiL = 1, entonces como en el caso de dos fac¬ 
tores, las interacciones de alto grado deben ser supuestas iguales a 0 para obtener un MCE 
que estime cr. Con L = 1 y haciendo caso omiso de la suma para el cuarto subíndice /, las 
fórmulas anteriores para las sumas de cuadrados continúan siendo válidas y la suma de cua¬ 
drados en cuanto a error es SCE = ¡¿Jijk con ^¡jk- = ^¡jk en I a expresión para y ljk . 

Ejemplo 11.10 Las siguientes observaciones (temperatura corporal — 100°F) se reportaron en un experi¬ 
mento para estudiar la tolerancia al calor de ganado (“The Significance of the Coat in Heat 
Tolerance of Cattle”, Australian J. Agriculture Research, 1959: 744-748). Se realizaron me¬ 
diciones en cuatro periodos diferentes (factor A, con I = 4) en dos razas diferentes de ganado 
(factor B, con J = 2) que tienen cuatro tipos distintos de pelaje (factor C, con K = 4); 
L = 3 observaciones realizadas por cada una de las 4 X 2 X 4 = 32 combinaciones de 
niveles de los tres factores. 

B l B z 



c, 

c 2 

c 3 

Q 

c, 

C 2 

c 3 

Q 


3.6 

3.4 

2.9 

2.5 

4.2 

4.4 

3.6 

3.0 


3.8 

3.7 

2.8 

2.4 

4.0 

3.9 

3.7 

2.8 


3.9 

3.9 

2.7 

2.2 

3.9 

4.2 

3.4 

2.9 


3.8 

3.8 

2.9 

2.4 

4.4 

4.2 

3.8 

2.0 

A-2 

3.6 

3.9 

2.9 

2.2 

4.4 

4.3 

3.7 

2.9 


4.0 

3.9 

2.8 

2.2 

4.6 

4.7 

3.4 

2.8 


3.7 

3.8 

2.9 

2.1 

4.2 

4.0 

4.0 

2.0 

^3 

3.9 

4.0 

2.7 

2.0 

4.4 

4.6 

3.8 

2.4 


4.2 

3.9 

2.8 

1.8 

4.5 

4.5 

3.3 

2.0 


3.6 

3.6 

2.6 

2.0 

4.0 

4.0 

3.8 

2.0 

A 4 

3.5 

3.7 

2.9 

2.0 

4.1 

4.4 

3.7 

2.2 


3.8 

3.9 

2.9 

1.9 

4.2 

4.2 

3.5 

2.3 

La tabla de totales de celda (x ij( 

.) con todas las combinaciones de los tres factores 




B r 



b 2 



x tjk ■ 

Cj 

c 2 

c 3 

c 4 

c. 

C 2 

c 3 

Q 


11.3 

11.0 

8.4 

7.1 

12.1 

12.5 

10.7 

8.7 

^2 

11.4 

11.6 

8.6 

6.8 

13.4 

13.2 

10.9 

7.7 


11.8 

11.7 

8.4 

5.9 

13.1 

13.1 

11.1 

6.4 

a 4 

10.9 

11.2 

8.4 

5.9 

12.3 

12.6 

11.0 

6.5 
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11.3 ANOVA con tres factores 423 

La figura 11.8 muestra diagramas de las medias de celda correspondientes x¡j k . = x¡j k J3. Se 
regresará a estos diagramas después de considerar pruebas de varias hipótesis. La base para 
estas pruebas es la tabla ANOVA dada en la tabla 11.8. 


X 


x 


X 


X 


4.5 


3.5 



2.5 





«1 

Tabla 11.8 

B 2 B 2 B í B 2 B¡ 

Figura 11.8 Diagramas de x ijk para el ejemplo 11.10. 

Tabla ANOVA para el ejemplo 11.10 

B 2 

Origen 

gi 

Suma de cuadrados 

Cuadrados de la media 

f 

A 

/- 1 = 3 

0.49 

0.163 

4.13 

B 

/- 1 = 1 

6.45 

6.45 

163.29 

C 

K- 1 = 3 

48.93 

16.31 

412.91 

AB 

(I - 1)0 1 - 1) = 3 

0.02 

0.0067 

0.17 

AC 

(/ - l)(/0 - 1) = 9 

1.61 

0.179 

4.53 

BC 

(J - 1 ){K - 1) = 3 

0.88 

0.293 

7.42 

ABC (/ 

1 

1 

1 

II 

\o 

0.25 

0.0278 

0.704 

Error 

1JK(L - 1) = 64 

2.53 

0.0395 


Total 

UKL - 1 = 95 

61.16 



Como F 0019 64 = 2.70 y f ABC 

= MCABC/MCE = 

0.704 no excede de 2.70, se conclu- 



ye que las interacciones de tres factores no son significativas. Sin embargo, aunque también 
las interacciones AB no son significativas, tanto las interacciones AC como BC así como 
también los efectos principales parecen ser necesarios en el modelo. Cuando no existen in¬ 
teracciones ABC o AB , un diagrama de las x ljk , (= ¡± !jk ) por separado para cada nivel de C no 
deberá revelar ningunas interacciones sustanciales (si sólo las interacciones ABC son 
cero, los diagramas son más difíciles de interpretar: véase el artículo “Two-Dimensional 
Plots for Interpreting Interactions in the Three-Factor Analysis of Variance Model”, Amer. 
Statistician, mayo de 1979: 63-69). ■ 


Se pueden construir diagramas de diagnóstico para verificar las suposiciones de norma¬ 
lidad y varianza constante como se describió en secciones previas. Se puede utilizar el proce¬ 
dimiento de Tukey en ANOVA de tres factores (o más). El segundo subíndice en Q es el número 
de medias muéstrales que se están comparando y el tercero es grados de libertad para error. 

También se pueden analizar los modelos con efectos aleatorios y fijos. Las sumas 
de cuadrados y grados de libertad son idénticos al caso de efectos fijos, pero los cua¬ 
drados de la media esperados son, desde luego, diferentes para los efectos principales 
aleatorios o interacciones. Una buena referencia es el libro de Douglas Montgomery 
que aparece en la bibliografía del capítulo. 
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Diseños de cuadrados latinos 

Cuando varios factores tienen que ser estudiados al mismo tiempo, un experimento en el 
cual existe por lo menos una observación por cada combinación posible de niveles se cono¬ 
ce como diseño completo. Si los factores son A, B y C con I, J y K niveles, respectivamen¬ 
te, un diseño completo requiere por lo menos IJK observaciones. Con frecuencia un 
experimento de este tamaño es impracticable debido a las restricciones de costo, tiempo o 
espacio o literalmente imposible. Por ejemplo, si la variable de respuesta es ventas de un 
producto y los factores son configuraciones de exhibición diferentes, distintas tiendas y di¬ 
ferentes periodos, entonces sólo una configuración de exhibición puede ser realísticamente 
usada en una tienda dada en un periodo determinado. 

Un experimento con tres factores en el cual se realizan menos de IJK observaciones 
se llama diseño incompleto. Existen algunos diseños incompletos en los cuales el patrón de 
combinaciones de factores es tal que el análisis es directo. Un diseño de tres factores como 
ése se llama diseño de cuadrado latino. Es apropiado cuando I = J = K (p. ej., cuatro con¬ 
figuraciones de exhibición, cuatro tiendas y cuatro lapsos de tiempo) y todos los efectos de 
interacción de dos y tres factores se suponen ausentes. Si los niveles del factor A están iden¬ 
tificados con las filas de una tabla bidireccional y los niveles de B con las columnas de la 
tabla, entonces la característica definitoria de un diseño de cuadrado latino es que cada ni¬ 
vel del factor C aparece exactamente una vez en cada füa y exactamente una vez en cada 
columna. La figura 11.9 ilustra ejemplos de cuadrados latinos de 3 X 3, 4 X 4 y 5 X 5. Exis¬ 
ten 12 cuadrados latinos diferentes de 3 X 3 y el número de /V X /V cuadrados latinos dis¬ 
tintos se incrementa con rapidez con N (p. ej., cada permutación de las filas de un cuadrado 
latino dado produce un cuadrado latino y asimismo en el caso de permutaciones de colum¬ 
nas). Se recomienda que el cuadrado utilizado en realidad en un experimento particular se 
elija al azar del conjunto de todos los cuadrados posibles de la dimensión deseada; para más 
detalles, consulte una de las referencias del capítulo. 


B B B 



Figura 11.9 Ejemplos de cuadrados latinos. 



Se utilizará la letra N para denotar el valor común de /, J y K. Entonces un diseño 
completo con una observación por cada combinación requeriría N 3 observaciones, en tanto 
que un cuadrado latino requiere solo N 1 observaciones. Una vez que se selecciona un cua¬ 
drado particular, el valor de k (el nivel del factor C) queda determinado por completo por 
los valores de i y j. Para recalcar esto, se utiliza x ¡J(k) para denotar el valor observado cuan¬ 
do los tres factores están a los niveles i, j y k, respectivamente, con k tomando sólo un va¬ 
lor por cada par i, j. El modelo es entonces 


x m - M + a i + Pj + 8 k + e ij(k ) Uj,k - . ,N 

donde 'Z.a l = Y J ¡i j = Y.S k = 0 y las e :j(k) son independientes y normalmente distribui¬ 
das con media 0 y varianza cr 2 . 
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DEFINICIÓN 


e 


Ejemplo 11.11 



11.3 ANOVA con tres factores 

Se emplea la siguiente notación para los totales y promedios: 

x* = 2X 


425 


= IX-, 

j 

X,,. 
N 


m 


x.j. = IX, 


m 


x,. = 


X -r = 


x,, 

N 


X.. k = 


x.. k 

N 


1 m 


x = 


x... = IIX, 

i ./ 

X„ 

N 2 


m 


Obsérvese que aunque X¡ previamente sugería una suma doble, ahora corresponde a una so¬ 
la suma para todos los subíndices j (y los valores asociados de k). 


Las sumas de cuadrados para un experimento de cuadrado latino son 

stc = 22(x ¡m - x ...) 2 

i j 

gl = N 2 - 1 

sca = 22(x,. - x ...) 2 

i j 

gl = A - 1 

SCB = YZiX.j. - X ...) 2 

i j 

gl = N ~ 1 

scc = 22(x.. k - x ...) 2 

i j 

SCE = 22[x m - (£+ + Pj + á *)] 2 

i j 

gl = A - 1 

= 22(x m - x ,. - x . - x * + 2x ...) 2 

1 j 

gl = (A - 1)(A - 2) 

STC = SCA + SCB + SCC + SCE 




Cada cuadrado de la media es, por supuesto, la razón SC/gl. Para probar H oc : ó, = 
S 2 = • ■ ■ = S N = 0, el valor estadístico de prueba es f c = MCC/MCE, con H oc rechazada 
si f c > F aN _ l , N _ l) , N _ 2) . Las otras dos hipótesis nulas para efectos principales también son 
rechazadas si la razón F correspondiente excede de F aN _ l (A ,_ 1)(JV _ 2) . 

Si cualquiera de las hipótesis nulas es rechazada, las diferencias significativas pueden 
ser identificadas por me dio del procedimiento de Tukey. Después de calcular w = 
QaN,(N-i)(N- 2 ) ' VMCE/JV, los pares de medias muéstrales (las x ¡„, x- o x.. k ) que difieren 
por más de w corresponden a diferencias significativas entre los efectos del factor asociado 
(las a¡, o 8 k ). 

La hipótesis H oc es con frecuencia la de interés central. Se utiliza un diseño de cua¬ 
drado latino para controlar la variación externa de los factores Ay B, como se hizo median¬ 
te un diseño de bloques aleatorizados en el caso de un factor externo único. Así pues en el 
ejemplo de ventas de productos previamente mencionado, la variación debida tanto a las 
tiendas como a los lapsos de tiempo es controlada por un diseño de cuadrado latino, lo que 
permite que un investigador pruebe en cuanto a la presencia de efectos producidos por las 
diferentes configuraciones de exhibición de productos. 

En un experimento para investigar el efecto de la humedad relativa en la resistencia a la 
abrasión de piel recortada de un patrón rectangular (“The abrasión of Leather”, J. Inter. Soc. 
Leather Trades’ Chemists, 1946: 287), se utilizó un cuadrado latino de 6 X 6 para controlar 
la posible variabilidad a causa de la posición en las filas o columnas del patrón. Los seis 
niveles de humedad relativa estudiadas fueron 1 = 25%, 2 = 37%, 3 = 50%, 4 = 62%, 
5 = 75% y 6 = 87% con los siguientes resultados. 
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B (columnas) 



1 

2 

3 

4 

5 

6 

x¡~ 

1 

3 7.38 

4 5.39 

6 5.03 

2 5.50 

5 5.01 

*6.79 

35.10 

2 

2 7.15 

'8.16 

5 4.96 

4 5.78 

3 6.24 

6 5.06 

37.35 

3 

4 6.75 

«5.64 

3 6.34 

5 5.31 

>7.81 

2 8.05 

39.90 

A(filas) 4 

‘8.05 

3 6.45 

2 6.31 

6 5.46 

4 6.05 

s 5.51 

37.83 

5 

s 5.65 

5 5.44 

Q.27 

3 6.54 

2 7.03 

4 5.96 

37.89 

6 

5 6.00 

2 6.55 

4 5.93 

'8.02 

s 5.80 

3 6.61 

38.91 

X T 

40.98 

37.63 

35.84 

36.61 

37.94 

37.98 


Además, 

x..[ = 46.10, x.. 2 

= 40.59, 

x , 3 = 39.56, x„ 4 

= 35.86, 

x.. 5 = 32.23, 

x.. 6 = 32.64, x_ 

. = 226.98. En la tabla 11.9 aparecen más cálculos. 


Tabla 11.9 Tabla ANOVA para el ejemplo 11.11 




Origen de la variación 

gl 

Suma de cuadrados 

Cuadrado de la media / 

A (filas) 


5 


2.19 

0.438 

2.50 

B (columnas) 


5 


2.57 

0.514 

2.94 

C (tratamientos) 


5 

23.53 

4.706 

26.89 

Error 


20 


3.49 

0.175 


Total 


35 

31.78 





Puesto que ^0055 20 = 2-71 y 26.89 & 2.71, H oc es rechazada en favor de la hipótesis de que 
la humedad relativa sí afecta en promedio la resistencia a la abr asión. 

Para aplicar el procedimiento de Tukey, w = Q 0 05 6 2 o ‘' VMCE/6 = 4.45 \/(). 175/6 = 
0.76. Después de ordenar las x.. k y subrayarlas se obtiene 

75% 87% 62% 50% 37% 25% 

5.37 5.44 5.98 6.59 6.77 7.68 

En particular, la humedad relativa más baja aparentemente produce una resistencia a la abra¬ 
sión promedio verdadera más alta de manera significativa que cualquier otra humedad relati¬ 
va estudiada. ■ 


EJERCICIOS Sección 11.3 (27-37) 


27. Se estudió el rendimiento de una máquina de extrusión conti¬ 
nua que recubre tubos de acero con plástico como una función 
del perfil de temperatura del termostato (A, a tres niveles), ti¬ 
po de plástico (B, a tres niveles) y la velocidad de tomillo 
rotatorio que hace que el plástico pase a través del troquel for- 
mador de tubos (C, a tres niveles). Hubo dos réplicas (L = 2) 
con cada combinación de niveles de los factores, lo que pro¬ 
dujo un total de 54 observaciones del rendimiento. Las sumas 
de cuadrados fueron SCA = 14144.44, SCB = 5511.27, 
SCC = 244 696.39, SCAB = 1069.62, SCAC = 62.67, 
SCBC = 331.67, SCE = 3127.50 y STC = 270024.33. 

a. Construya la tabla ANOVA. 


b. Use pruebas F apropiadas para demostrar que ninguna 
de las razones F para interacción de dos o tres factores 
es significativa al nivel 0.05. 

c. ¿Qué efectos principales parecen significativos? 

d. Con jc„i. = 8242, x.. 2 . = 9732 y x.. 3 . = 11210, use el pro¬ 
cedimiento de Tukey para identificar diferencias signifi¬ 
cativas entre los niveles del factor C. 

28. Para ver si la fuerza de empuje al taladrar es afectada por la 
velocidad de taladrado (A), coeficiente de alimentación (B) 
o material utilizado (Q, se realizó un experimento utilizan¬ 
do tres velocidades, tres coeficientes y dos materiales con dos 
muestras (L = 2) taladradas con cada combinación de niveles 
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de los tres factores. Las sumas de cuadrados se calcularon 
como sigue: SCA = 19 149.73, SCB = 2589047.62, SCC = 
157437.52, SCAB = 53 238.21, SCAC = 9033.73, SCBC = 
91 880.04, SCE = 56,819.50 y STC = 2983 164.81. Constru¬ 
ya la tabla ANOVA e identifique interacciones significativas 
con a = 0.01. ¿Existe algún factor que parezca no tener efec¬ 
to en la fuerza de empuje? (En otras palabras, ¿parece ser al¬ 
gún factor no significativo en todo efecto en el que aparece?) 

29. El artículo “An Analysis of Variance Applied to Screw Ma¬ 
chines” (Industrial Quality Control , 1956: 8-9) describe un 
experimento para investigar cómo la longitud de barras de 
acero se vio afectada por la hora del día (A), el tratamiento 
térmico aplicado (B) y la máquina de roscar utilizada (C). 
Las tres horas fueron 8:00 A.M., 11:00 a.m. y 3:00 p.m. y hu¬ 
bo tres tratamientos y cuatro máquinas (un experimental 
factorial de 3 X 2 X 4) y se obtuvieron los datos adjuntos 
[codificados como 1000(longitud — 4.380), lo cual no afec¬ 
ta el análisis]. 


B i 



Q 

c 2 

c 3 

Q 


6, 9, 

7, 9, 

1, 2, 

6, 6, 


1, 3 

5, 5 

0,4 

7, 3 

A-i 

6, 3, 

8, 7, 

3,2, 

7, 9, 


1,-1 

4, 8 

L 0 

11, 6 

^3 

5,4, 

10, 11, 

-L 2, 

10, 5, 


9, 6 

6,4 

6, 1 

4, 8 



B 




Q 

c 2 

c 3 

Q 

Ar 

4, 6, 

6, 5, 

-1, 0, 

4, 5, 


0, 1 

3,4 

0, 1 

5,4 

^2 

3, 1, 

6, 4, 

2, 0, 

9, 4, 


1,-2 

1, 3 

-1, 1 

6, 3 

A 3 

6, 0, 

8, 7, 

0,-2, 

4, 3, 


3, 7 

10, 0 

4,-4 

7,0 


Las sumas de los cuadrados incluyen SCAB = 1.646, 
SCAC = 71.021, SCBC = 1.542, SCE = 447.500 y 
STC = 1037.833. 

a. Construya la tabla ANOVA con estos datos. 

b. Pruebe para ver si algunos efectos de interacción son 
significativos al nivel 0.05. 

c. Pruebe para ver si algunos efectos de interacción son 
significativos al nivel 0.05 (es decir, H 0A contra H^, etc.). 

d. Use el procedimiento de Tukey para investigar diferen¬ 
cias significativas entre las cuatro máquinas. 

30. Se calcularon las siguientes cantidades con un experimento 
que implicó cuatro niveles de nitrógeno (A), dos tiempos de 
plantación (B) y dos niveles de potasio (C) (“Use and Misu- 
se of Múltiple Comparison Procedures”, Agronomy J., 
1977: 205-208). Se realizó sólo una observación (contenido 
de N, en porcentaje, de granos de maíz) por cada una de las 
16 combinaciones de niveles. 


SCA = 0.22625 SCB = 0.000025 SCC = 0.0036 
SCAB = 0.004325 SCAC = 0.00065 
SCBC = 0.000625 STC = 0.2384. 

a. Construya la tabla ANOVA. 

b. Suponga que no existen efectos de interacción en tres di¬ 
recciones, de modo que MCABC es una estimación vá¬ 
lida de a 2 y pruebe al nivel 0.05 en cuanto a interacción 
y efectos principales. 

c. Los promedios de nitrógeno son x¡„ = 1.1200, x,.. = 
1.3025, x 3 .. = 1.3875 y x 4 „ = 1.4300. Use el método de 
Tukey para examinar las diferencias de porcentaje N en¬ 
tre los niveles de nitrógeno (< 2 0 05 4 3 = 6.82). 

31. El artículo “Kolbe-Schmitt Carbonation of 2-Naphthol” ( In¬ 
dustrial and Engr. Chemistry: Process and Design Develop- 
ment, 1969: 165-173) presentó los datos adjuntos sobre 
porcentaje de rendimiento de ácido BON en función del 
tiempo de reacción (1, 2 y 3 horas), temperatura (30, 70 y 
100°C) y presión (30, 70 y 100 lb/pulg 2 ). Suponiendo que no 
existe interacción de tres factores, de modo que SCE = 
SCABC proporcione una estimación de <r 2 . MINITAB dio la 
tabla ANOVA adjunta. Realice todas las pruebas apropiadas. 



Q 

B i 

c 2 

c 3 

Ai 

68.5 

73.0 

68.7 

^2 

74.5 

75.0 

74.6 

A 3 

70.5 

72.5 

74.7 



b 2 



Ci 

c 2 

c 3 

A, 

72.8 

80.1 

72.0 

^2 

72.0 

81.5 

76.0 

^3 

69.5 

84.5 

76.0 



b 3 



Ci 

C 2 

c 3 

Ai 

72.5 

72.5 

73.1 

^2 

75.5 

70.0 

76.0 

^3 

65.0 

66.5 

70.5 


Analysis of 

Variance for 

Yield 




Source 

DF 


SS 


MS 


F 


P 

time 

2 

42 , 

. 112 

21 

.056 

8. 

.76 

0 . 

.010 

temp 

2 

110 . 

.732 

55 

.366 

23 . 

.04 

0 . 

.000 

press 

2 

68. 

.136 

34 

.068 

14 . 

.18 

0 . 

.002 

time* temp 

4 

67. 

.761 

16 

.940 

7 , 

.05 

0 . 

.010 

time*press 

4 

35. 

. 184 

8 

.796 

3 , 

.66 

0 . 

.056 

temp*press 

4 

136. 

.437 

34 

.109 

14 . 

.20 

0 . 

.001 

Error 

8 

19. 

.223 

2 

.403 





Total 

26 

479 . 

.585 
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32. 


Cuando los factores A y B son fijos pero el factor C es 
aleatorio y se utiliza el modelo restringido (véase la nota 
del pie de la página 416; existe una complicación técnica 
con el modelo no restringido en este caso), 

E(MCE) = a 2 

JKL „ 


Semana 


£(MCA) = a 2 + JLa\ c + 


£(MCB) = a 
£(MCC) = a 


2 + ILv\c + 


I - 1 
1KL 
J - 1 




£(MCAB) = a 2 + Ijj 2 abc 


KL 


(/ - i)(y - i) 

£(MCAC) = a 
£(MCBC) = a 
£(MCABC) = a 




r2 + JLv\c 

r2 + IUr lc 

' 2 + Lir AHC 


a. 


b. 


Basado en estos cuadrados de la media esperados, ¿qué 
razones £ utilizaría para probar H a \ a Anc = 0; H 0 : a ¿ = 0; 


H n 


yj? = 0 para todos los subíndices i, 


j Y 


En un experimento para valuar los efectos de la edad, el ti¬ 
po de suelo y el día de la producción en la resistencia a la 
compresión de mezclas de cemento/suelo, se utilizaron 
dos edades (A), cuatro tipos de suelo (B) y 3 días (C, su¬ 
puesto aleatorio), con £ = 2 observaciones realizadas por 
cada combinación de niveles de factor. Las sumas 
de cuadrados resultantes fueron SCA = 14318.24, 
SCB = 9656.40, SCC = 2270.22, SCAB = 3408.93, 
SCAC = 1442.58, SCBC = 3096.21, SCABC = 2832.72 
y SCE = 8655.60. Obtenga la tabla ANOVA y realice to¬ 
das las pruebas al nivel 0.01. 

33. Debido a la variabilidad potencial del envejecimiento causado 
por las diferentes piezas fundidas y segmentos en éstas, se uti¬ 
lizó un diseño de cuadrado latino con N =7 para investigar el 
efecto del tratamiento térmico en el envejecimiento. Con A = 
piezas fundidas, B — segmentos, C = tratamientos térmicos, 
los estadísticos resumidos incluyen x... = 3815.8, 2a?. = 
297 216.90, 2 x 2 j . = 297 200.64, Zx 2 . k = 297 155.01 y 
22A§(t) = 297 317.65. Obtenga la tabla ANOVA y pruebe al 
nivel 0.05 la hipótesis de que el tratamiento térmico no afecta 
el envejecimiento. 

34. El artículo “The Responsiveness of Food Sales to Shelf 
Space Requirements” (J. Marketing Research, 1964: 63-67) 
reporta el uso de un diseño de cuadrado latino para investi¬ 
gar el efecto del espacio de anaquel en las ventas de alimen¬ 
tos. El experimento se realizó a lo largo de 6 semanas con 
seis tiendas diferentes y se obtuvieron los siguientes resul¬ 
tados sobre ventas de crema en polvo para café (con el ín¬ 
dice de espacio de anaquel entre paréntesis): 

Semana 



4 

5 

6 

1 

35(1) 

28 (6) 

22 (2) 

2 

46 (3) 

37 (2) 

23(1) 

3 

49 (4) 

38(1) 

48 (3) 

4 

70 (6) 

37(4) 

50 (5) 

5 

9(2) 

18(5) 

17(6) 

6 

12 (5) 

19(3) 

22 (4) 


Tienda 


Construya la tabla ANOVA y formule y pruebe al nivel 0.01 
la hipótesis de que el espacio de anaquel no afecta las ven¬ 
tas contra la alternativa apropiada. 

35. El artículo “Variation in Moisture and Ascorbic Acid Contení 
from Leaf to Leaf and Plant to Plant in Tumip Greens” (Sout¬ 
hern Cooperative Services Bull. , 1951: 13-17) usa un diseño 
de cuadrado latino en el cual el factor A es la planta, el factor 
B es el tamaño de hoja (desde el más pequeño hasta el más 
grande), el factor C (entre paréntesis) es tiempo de pesada y 
la variable de respuesta es el contenido de humedad. 

Tamaño de hoja (B) 


Planta (A) 



1 

2 

3 

1 

6.67 (5) 

7.15 (4) 

8.29 (1) 

2 

5.40 (2) 

4.77 (5) 

5.40 (4) 

3 

7.32 (3) 

8.53 (2) 

8.50 (5) 

4 

4.92 (1) 

5.00 (3) 

7.29 (2) 

5 

4.88 (4) 

6.16 (1) 

7.83 (3) 


Tamaño de hoja (B) 



4 

5 


1 

8.95 (3) 

9.62 (2) 


2 

7.54(1) 

6.93 (3) 


3 

9.99 (4) 

9.68 (1) 


4 

7.85 (5) 

7.08 (4) 


5 

5.83 (2) 

8.51 (5) 



Planta (A) 


Cuando los tres factores son aleatorios, los cuadrados de la 
media esperados son £(MCA) = a 2 + Na\, £(MCB) = 
a 2 + Na 2 , £(MCC) = a 2 + Na 2 c y £(MCE) = a 2 . Esto im¬ 
plica que las razones £ para probar H 0A : = 0, H 0B : o% = 0 

y H oc : a¿ — 0 son idénticas a aquellas para efectos fijos. Ob¬ 
tenga la tabla ANOVA y pruebe al nivel 0.05 para ver si exis¬ 
te alguna variación en el contenido de humedad debido a los 
factores. 

36. El artículo ‘An Assessment of the Efects of Treatment, Time 
and Heat on the Removal of Erasable Pen Marks from Cotton 
and Cotton/Polyester Blend Fabrics” ( J. Testing and Eval., 
1991: 394-397) reporta las siguientes sumas de cuadrados 
para la variable de respuesta grado de eliminación de marcas: 


Tienda 



1 

2 

3 

1.432, SCAC = 15.953, SCBC = 1.382, SCABC = 9.016 y 

1 

27 (5) 

14(4) 

18(3) 

SCE = 115.820. Se utilizaron cuatro tratamientos de lavado 

2 

34 (6) 

31 (5) 

34 (4) 

diferentes, tres tipos distintos de pluma y seis telas diferentes 

3 

39 (2) 

67 (6) 

31 (5) 

en el experimento y se realizaron tres observaciones por cada 

4 

40 (3) 

57(1) 

39(2) 

combinación de pluma-tela. Analice la varianza con a = 0.01 

5 

15 (4) 

15(3) 

11 (1) 

por cada prueba y exprese sus conclusiones (suponga efectos 

6 

16(1) 

15(2) 

14(6) 

fijos para los tres factores). 
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37. Se realizó un experimento ANOVA con cuatro factores para 
investigar los efectos de la tela (A), el tipo de exposición ( B ), 
el nivel de exposición (C) y la dirección de la tela ( D ) en el 
grado de cambio de color en telas expuestas medido por me¬ 
dio de un espectrocolorímetro. Se realizaron dos observacio¬ 
nes por cada una de las tres telas, dos tipos, tres niveles y dos 
direcciones con los siguientes resultados: MCA = 2207.329, 
MCB = 47.255, MCC = 491.783, MCD = 0.044, MCAB = 


15.303, MCAC = 275.446, MCAD = 0.470, MCBC = 
2.141, MCBD = 0.273, MCCD = 0.247, MCABC = 3.714, 
MCABD = 4.072, MCACD = 0.767, MCBCD = 0.280, 
MCE = 0.977 y CMT = 93.621. (‘Accelerated Weathering of 
Marine Fabrics”, J. Testing and Eval., 1992: 139-143). Supo¬ 
niendo efectos fijos con todos los factores, realice un análisis 
de varianza con a — 0.01 con todas las pruebas y resuma sus 
conclusiones. 



| 11.4 Experimentos 2 P factoriales 

Si un experimentador desea estudiar al mismo tiempo el efecto de p factores diferentes en 
una variable de respuesta y los factores tienen / t , / 2 , . . . , / niveles, respectivamente, enton¬ 
ces un experimento completo requiere por lo menos /, • / 2 . I p observaciones. En tales 

situaciones, el experimentador a menudo puede realizar un “experimento de filtración” con 
cada factor a sólo dos niveles para obtener información preliminar sobre los efectos del fac¬ 
tor. Un experimento en el cual existen p factores, cada uno a dos niveles, se conoce como 
experimento 7P factorial. El análisis de los datos de tal experimento es computacionalmen- 
te más simple que para experimentos factoriales más generales. Además, un experimento 2 P 
proporciona un entorno más simple para introducir los importantes conceptos de confusión 
y réplicas fraccionarias. 

2 ? experimentos 

Como en la sección 11.3, si X i¡kl y x l]kj se refieren a la observación de /-ésima réplica con los 
factores A, B y C a los niveles i,j y k, respectivamente. El modelo en esta situación es 


x m = m + «/ + Pj + 8 k + yf + yf + yf + y,,* + C 1114 ) 


con i = 1,2 ;j = 1,2 ; k = 1,2;/= 1. n. Las e l]kl se suponen independientes, normal¬ 

mente distribuidas, con media 0 y varianza cr 2 . Como existen sólo dos niveles de cada fac¬ 
tor, las condiciones colaterales en relación con los parámetros de (11.14) que especifican de 
manera única el modelo simplemente se formulan como aq + aq = 0, . . . , y']'' + y 2 f = 0, 
y A n + y 22 = 0, y'lf + y'if = 0, y^f + y^f = 0 y similares. Estas condiciones implican que 
existe sólo un parámetro funcionalmente independiente de cada tipo (por cada efecto prin¬ 
cipal e interacción). Por ejemplo, a 2 = — a v mientras que y 2 f = -y^f, y A l2 = ^y^f y 
T 22 = y A n- Debido a esto, cada suma de cuadrados en el análisis tendrá un grado de libertad. 

Los parámetros del modelo pueden ser estimados sacando promedios para todos los 
subíndices de las X ljkl y luego formando combinaciones lineales apropiadas de los prome¬ 
dios. Por ejemplo, 

á, = X h „ - X.... 

_ (^111- + ^121- X ll2- ^122- ~ ^211- ~ ^212- ~ ^221- ~ ^222-) 

8/7 

Tu = *n.. - *,... - *i.. + *... 

_ (*111- ~ *121- ~ *211- + *221- *112- ~ *122- ~ *212- *222-) 

8 n 


y 
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Cada estimador es, con excepción del factor l/(8nj, una función lineal de los totales de cel¬ 
da (X ljk ,) donde cada coeficiente es +1 o —1, con un número igual de cada uno; tales fun¬ 
ciones se llaman contrastes en las X l]k . Además, los estimadores satisfacen las mismas 
condiciones colaterales satisfechas por los parámetros mismos. Por ejemplo, 


£i l + a 2 = Xj... — X... 

+ X 2 ... - X... = X^.. 

+ 2f 2 ... 

- 2X... 

1 

1 2 

1 

1 

II 

>1 

+ 

II 

X 

1 

—X 

-X 

4 n 

4 n 8n 

4/z 

4 n 


Ejemplo 11.12 En un experimento para investigar las propiedades de resistencia a la compresión de mez¬ 
clas de cemento-tierra, se utilizaron dos periodos de añej amiento en combinación con tem¬ 
peraturas de añejamiento y dos tierras diferentes. Se hicieron dos réplicas por cada 
combinación de niveles de los tres factores y se obtuvieron los siguientes resultados: 

Suelo 


Añejamiento 

Temperatura 

1 

2 

1 

1 

471,413 

385, 434 


2 

485, 552 

530, 593 

2 

1 

712, 637 

770, 705 


2 

712, 789 

741, 806 



Los totales de celda calculados son x m . = 884, x 211 . = 1349, x m . = 1037, x 22 ¡. = 1501, 
x ll2 . = 819, x 2l2 . = 1475, x 122 . = 1123 y x 222 . = 1547, por lo tanto x..„ = 9735. Entonces 

= (884 - 1349 + 1037 - 1501 + 819 - 1475 + 1123 - 1547)/16 
= -125.5625 = -á 2 

y A, ¡ = (884 - 1349 - 1037 + 1501 + 819 - 1475 - 1123 + 1547)/16 
= -14.5625 = -r,í = -7Í1 = jfi 

Las estimaciones de los demás parámetros se calculan de la misma manera. ■ 

Análisis de un experimento 2 3 La razón para calcular estimaciones de parámetro es que 
las sumas de cuadrados para los varios efectos son fáciles de obtener a partir de las estima¬ 
ciones. Por ejemplo, 

SCA = = 4 a] = 4n[a\ + (-áj) 2 ] = 8na 2 

i j k l i= 1 

y 

SCAB = IIEIlyff) 2 
i j k I 

= 2 r¿ ¿ (y??) 2 = 2n[(y AR ] ) 1 + (-y**) 2 + (-y AR ) 2 + (y^) 2 ] 
i=ij=i 

= Myil) 2 

Como cada estimación es un contraste en los totales de celda multiplicado por l/(8«), 
cada suma de cuadrados tiene la forma (contraste) 2 /(8«). Por lo tanto para calcular las diver¬ 
sas sumas de cuadrados, se tienen que conocer los coeficientes (+1 o — 1) de los contrastes 
apropiados. Los signos (+ o —) de cada x ijk en cada contraste de efecto son más convenien¬ 
temente mostrados en una tabla. Se utilizará la notación (1) para la condición experimental 
i = l,y = 1, k = 1, a para i = 2, j = 1, k = 1 , ab para i = 2,j = 2, k = 1, y así sucesiva¬ 
mente. Si el nivel 1 se considera como “bajo” y el nivel 2 como “alto”, cualquier letra que 
aparezca denota un nivel alto del factor asociado. En la tabla 11.10, cada columna da los 
signos para un contraste de efecto particular en las x ¡jk , asociados con las diferentes conclu¬ 
siones experimentales. 























cll_p397-445.qxd 3/12/08 


Page 431 


4:27 AM 



11.4 Experimentos V factoriales 431 


Tabla 11.10 Signos para calcular contrastes de efecto 


Condición 

experimental 

Total de 

celda 

A 

B 

Efecto factorial 

C AB AC 

BC 

ABC 

(1) 

x m. 

- 

- 

- 

+ 

+ 

+ 

- 

a 

3-211- 

+ 

- 

~ 

- 

- 

+ 

+ 

b 

3-121- 

- 

+ 

- 

- 

+ 

- 

+ 

ab 

•*221- 

+ 

+ 

- 

+ 

- 

- 

- 

c 

3-112- 

- 

- 

+ 

+ 

- 

- 

+ 

ac 

3-212- 

+ 

- 

+ 

- 

+ 

- 

- 

be 

3-122- 

- 

+ 

+ 

- 

- 

+ 

- 

abe 

x 222- 

+ 

+ 

+ 

+ 

+ 

+ 

+ 



En cada una de las tres primeras columnas, el signo es + si el factor correspondiente 
está al nivel alto y — si está al nivel bajo. Cada signo que aparece en la columna AB es en¬ 
tonces el “producto” de los signos presentes en las columnas A y B (+)(+) = (—)(—) = + 
y (+)(—) = (—)(+) = — y del mismo modo para las columnas AC y BC. Por último, los 
signos que aparecen en la columna ABC son los productos de AB con C (o B con AC o A 
con BC). Así pues, por ejemplo, 

contraste AC — + x m . — x 2 \\. + -^ 121 - — 3-221- — * 112 - 3 - 212 - ~ x i 22 - x 222 - 

Una vez que se calculan los siete contrastes de efecto, 

sc(efect0) = (contraste de efecto) 2 

8 n 

Incluso con una tabla de signos, el cálculo de los contrastes es tedioso. Una técnica 
computacional eficiente, creada por Yates, es la siguiente. Se escriben en una columna los 
ocho totales de celda en el orden estándar como aparece en la tabla de signos y se estable¬ 
cen tres columnas adicionales. En cada una de estas tres columnas, las primeras cuatro en¬ 
tradas son las sumas de las entradas 1 y 2, 3 y 4, 5 y 6 , 7 y 8 de las columnas previas. Las 
últimas cuatro entradas son las diferencias entre las entradas 2y I,4y3,6y5y8y7de 
la columna previa. La última columna contiene entonces x... y los siete contrastes de efecto 
en orden estándar. Si se eleva al cuadrado cada contraste y se divide entre 8/7 se obtienen en¬ 
tonces las siete sumas de cuadrados. 

Ejemplo 11.13 Como n = 2 , 8 n = 16, el método de Yates se ilustra en la tabla 11.11. 

(continuación del 
ejemplo 11.12) 

Tabla 11.11 Método de Yates de cálculo 


Condición de 

tratamiento x ijk . 1 2 Contraste de efecto SC = (contraste) 2 /16 


(!) = *111. 
(X X2 11 . 

b = x m . 
ab .V 22 ]. 

c = *112. 
ac = x 212 . 
be = x 122 . 
abe = x 222 . 



1547 424 -232 


9735 

2009 

681 

-233 

193 

151 

71 

-231 


252255.06 
28 985.06 
3 393.06 
2328.06 
1425.06 
315.06 
3 335.06 
292036.42 
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Con los datos originales, = 6232289, y 

— = 5 923 139.06 
16 

por lo tanto 

STC = 6232289 - 5 923 139.06 = 309 149.94 
SCE = STC - [SCA + • ■ ■ + SCABC] = 309 149.94 - 292036.42 
= 17113.52 

Los cálculos ANOVA se resumen en la tabla 11.12. 


Tabla 11.12 Tabla ANOVA para el ejemplo 11.13 


Origen de 
la variación 

gl 

Suma de cuadrados 

Cuadrados de la media 

/ 

A 

1 

252255.06 

252255.06 

117.92 

B 

1 

28985.06 

28985.06 

13.55 

C 

1 

2328.06 

2328.06 

1.09 

AB 

1 

3 393.06 

3 393.06 

1.59 

AC 

1 

1425.06 

1 425.06 

0.67 

BC 

1 

315.06 

315.06 

0.15 

ABC 

1 

3 335.06 

3 335.06 

1.56 

Error 

8 

17113.52 

2139.19 


Total 

15 

309 149.94 




La figura 11.10 muestra los resultados generados por SAS para este ejemplo. Sólo los 
valores P correspondientes a la edad (A) y temperatura (B) son menores que 0.01, así que 
sólo estos efectos son considerados significativos. 



Analysis of Variance Procedure 
Dependent Variable: STRENGTH 





Sum of 

Mean 



Source 

DF 

Squares 

Square 

F Valué 

Pr > F 

Model 


7 

292036.4375 

41719.4911 

19.50 

0.0002 

Error 


8 

17113.5000 

2139.1875 



Corrected 

Total 15 

309149.9375 





R-Square 


C.V. 

Root MSE 

POWERUSE Mean 


0.944643 


7.601660 

46.25135 

608 

.437500 

Source 

DF 


Anova SS 

Mean Square 

F Valué 

Pr > F 

AGE 

1 


252255.0625 

252255.0625 

117.92 

0.0001 

TEMP 

1 


28985.0625 

28985.0625 

13.55 

0.0062 

AGE*TEMP 

1 


3393.0625 

3393.0625 

1.59 

0.2434 

SOIL 

1 


2328.0625 

2328.0625 

1.09 

0.3273 

AGE*SOIL 

1 


1425.0625 

1425.0625 

0.67 

0.4380 

TEMP*SOIL 

1 


315.0625 

315.0625 

0.15 

0.7111 

AGE* TEMP*; 

SOIL 1 


3335.0625 

3335.0625 

1.56 

0.2471 


Figura 11.10 


Resultados obtenidos con SAS con los datos de resistencia del ejemplo 11.13. ■ 


Experimentos 2 p con p > 3 

Aunque los cálculos cuando p > 3 son bastante tediosos, el análisis es igual al del caso de 
tres factores. Por ejemplo, si existen cuatro factores A, B, C y D, existen 16 condiciones ex¬ 
perimentales diferentes. Las primeras 8 en orden estándar son exactamente las que ya apa¬ 
recen en lista para un experimento con tres factores. Las segundas 8 se obtienen colocando 





















cll_p397-445.qxd 3/12/08 


4:27 AM Page 433 




11.4 Experimentos V factoriales 433 

la letra d al lado de cada condición en el primer grupo. El método de Yates se inicia enton¬ 
ces calculando totales a través de las réplicas, poniendo en lista estos totales en orden están¬ 
dar y procediendo como antes, con p factores, la p-ésima columna a la derecha de los totales 
de tratamiento dará los contrastes de efecto. 

Con p > 3, con frecuencia no habrá réplicas del experimento (así que sólo una repli¬ 
ca está disponible). Una posible forma de probar hipótesis es suponer que ciertos efectos 
de alto grado están ausentes y luego agregar las sumas correspondientes de cuadrados para 
obtener un SCE. Tal suposición, sin embargo, puede ser engañosa si no se tiene un conoci¬ 
miento previo (véase el libro de Montgomery que aparece en la bibliografía del capítulo). 
Un método alternativo implica trabajar directamente con los contrastes de efecto. Cada 
contraste tiene una distribución normal con la misma varianza. Cuando un efecto particular 
está ausente, el valor esperado del contraste correspondiente es 0, pero esto no es así cuando 
el efecto está presente. El método de análisis sugerido es construir un diagrama de probabi¬ 
lidad normal de los contrastes de efecto (o, en forma equivalente, las estimaciones de los 
parámetros de efecto, puesto que estimación = contraste^ cuando n = 1). Los puntos co¬ 
rrespondientes a efectos ausentes tenderán a acercarse a una línea recta, mientras que los 
puntos asociados con efectos sustanciales en general se alejarán de esta línea. 

Ejemplo 11.14 Los datos adjuntos se tomaron del artículo “Quick and Easy Analysis of Unreplicated Fac- 
torials” ( Technometrics , 1989: 469-473). Los cuatro factores son A = resistencia al ácido, 
B = tiempo, C = cantidad de ácido y D = temperatura y la variable de respuesta es el 
rendimiento de isatina. Las observaciones, en orden estándar, son 0.08, 0.04, 0.53, 0.43, 
0.31, 0.09, 0.12, 0.36, 0.79, 0.68, 0.73, 0.08, 0.77, 0.38, 0.49 y 0.23. La tabla 11.13 mues¬ 
tra las estimaciones de efecto como aparecen en el artículo (las cuales utilizaron contraste/8 
en lugar de contraste/16). 


Tabla 11.13 Estimaciones de efecto para el ejemplo 11.14 


Efecto 

A 

B 

AB 

C 

AC 

BC 

ABC 

estimación 

-0.191 

-0.021 

-0.001 

-0.076 

0.034 

-0.066 

0.149 

Efecto 

AD 

BD 

ABD 

CD 

ACD 

BCD 

ABCD 

estimación 

-0.161 

-0.251 

-0.101 

-0.026 

-0.066 

0.124 

0.019 



La figura 11.11 es un diagrama de probabilidad normal de las estimaciones de efecto. To¬ 
dos los puntos en el diagrama quedan cerca de la misma línea recta, lo que sugiere la ausen¬ 
cia completa de cualquier efecto (en breve se dará un ejemplo en el cual éste no es el caso). 


0.3 
o 0.2 

O 
q-H 
<D 

<D 0.1 

i - 

S 

a -0.1 
- 0.2 
-0.3 

Figura 11.11 Diagrama de probabilidad normal de estimaciones de efecto del ejemplo 11.14. 






















CAPITULO 11 Análisis de varianza con varios factores 


Los juicios visuales de la desviación con respecto a la derechura en un diagrama de 
probabilidad normal son más bien subjetivos. El artículo citado en el ejemplo 11.14 describe 
una técnica más objetiva de identificar efectos significativos en un experimento no replicado. 

Confusión 

A menudo no es posible realizar todas las 2 P condiciones experimentales de un experimen¬ 
to 2 P factorial en un entorno experimental homogéneo. En tales situaciones, puede ser posi¬ 
ble separar las condiciones experimentales en 2 r bloques homogéneos O < p), de modo que 
existen 2 P r condiciones experimentales en cada bloque. Los bloques pueden, por ejemplo, 
corresponder a laboratorios diferentes, lapsos de tiempo distintos u operadores o cuadrillas 
de trabajo diferentes. En el caso más simple, p = 3 y r = l,de modo que existen dos blo¬ 
ques con cada uno compuesto de cuatro de las ocho condiciones experimentales. 

Como siempre, la formación de bloques es efectiva al reducir la variación asociada 
con fuentes externas. Sin embargo, cuando las 2 P condiciones experimentales se colocan en 
21 bloques, el precio pagado por esta formación de bloques es que 2' — I de los efectos de 
factor no pueden ser estimados. Esto es porque los 2 r — 1 efectos de factor (efectos princi¬ 
pales y/o interacciones) se mezclan o confunden con los efectos de bloque. La asignación 
de condiciones experimentales a bloques normalmente se hace de modo que sólo las inte¬ 
racciones de más alto nivel sean confundidas, mientras que los efectos principales y las in¬ 
teracciones de orden más bajo permanecen estimables y las hipótesis pueden ser probadas. 

Para ver cómo se logra la asignación de bloques, considérese primero un experimento 
2 3 con dos bloques (r = 1) y cuatro tratamientos por bloque. Supóngase que se selecciona 
ABC como el efecto que ha de ser confundido con bloques. Entonces cualquier condición 
experimental que tenga un número impar de letras en común con ABC , tal como b (una le¬ 
tra) o abe (tres letras) se coloca en un bloque, mientras que cualquier condición que tenga 
un número par de letras en común con ABC (donde 0 es par) va en el otro bloque. La figu¬ 
ra 11.12 muestra esta asignación de tratamientos a los dos bloques. 


Bloque 1 


(1), ab, ac, be 


Bloque 2 


a, b, c, abe 


Figura 11.12 Confusión de ABC en un experimento V. 

Sin réplicas, los datos de semejante experimento normalmente se analizarían supo¬ 
niendo que no hubo interacciones de dos factores (aditividad) y utilizando SCE = SCAB + 
SCAC + SCBC con 3 grados de libertad (gl) para probar en cuanto a la presencia de efec¬ 
tos principales. Alternativamente, un diagrama de probabilidad normal de contrastes de 
efecto o estimaciones de parámetros de efecto podría ser examinado. Con más frecuencia, 
no obstante, existen réplicas cuando sólo tres factores están siendo estudiados. Supóngase 
que existen u réplicas, que dan un total de 2 r ■ u bloques en el experimento. Entonces des¬ 
pués de restar de STC todas las sumas de cuadrados asociadas con efectos no confundidos 
con bloques (calculados con el método de Yates), el bloque de la suma de cuadrados se 
calcula con los 2' • u totales de bloque y luego se restan para obtener SCE (de modo que existen 
2 r ■ u — 1 grados de hbertad por bloque). 

Ejemplo 11.15 El artículo “Factorial Experiments in Pilot Plant Studies” (Industrial and Eng. Chemistry , 
1951: 1300-1306) reporta los resultados de un experimento para valuar los efectos de tem¬ 
peratura de reactor (A) rendimiento de gas ( B ) y concentración de constituyente activo (C) 
en la concentración de la solución producto (medida en unidades arbitrarias) en una unidad 
de recirculación. Se utilizaron dos bloques, con el efecto ABC confundido con bloques y hubo 
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dos réplicas y los resultados aparecen en la figura 11.13. Los cuatro totales de bloque X répli¬ 
ca son 288, 212, 88 y 220 con un gran total de 808, por lo tanto 

Scbi = (288) 2 + (212) 2 + (88) 2 + (220) 2 _ (808) 2 = 52Q4 
4 16 


Réplica 1 

Bloque 1 Bloque 2 


(1) 

99 

ab 

52 

ac 

42 

be 

95 


a 

18 

b 

51 

c 

108 

abe 

35 


Réplica 2 

Bloque 1 Bloque 2 


(1) 

46 

ab 

-Al 

ac 

22 

be 

67 


a 

18 

b 

62 

c 

104 

abe 

36 


Figura 11.13 Datos para el ejemplo 11.15. 


Las demás sumas de cuadrados se calculan con el método de Yates utilizando los ocho 
totales de condición experimental y el resultado es la tabla ANOVA dada como tabla 11.14. 
Por comparación con F 00516 = 5.99, se concluye que sólo los efectos principales para A y 
C difieren significativamente de cero. 


Tabla 11.14 Tabla ANOVA para el ejemplo 11.15 


Origen de 
la variación 

gl 

Suma de cuadrados 

Cuadrados de la media 

/ 

A 

1 

12 996 

12996 

39.82 

B 

1 

702.25 

702.25 

2.15 

C 

1 

2 756.25 

2756.25 

8.45 

AB 

1 

210.25 

210.25 

0.64 

AC 

1 

30.25 

30.25 

0.093 

BC 

1 

25 

25 

0.077 

Bloques 

3 

5 204 

1 734.67 

5.32 

Error 

6 

1958 

326.33 


Total 

15 

23 882 




Confusión cuando se utilizan más de dos bloques 

En el caso r = 2 (cuatro bloques), tres efectos se confunden con bloques. El experimentador 
primero selecciona dos efectos definitorios que han de ser confundidos. Por ejemplo, en un 
experimento con cinco factores (A, B, C, D y E), las dos interacciones de tres factores BCD 
y CDE podrían ser elegidas para confundirse. El tercer efecto confundido es entonces la in¬ 
teracción generalizada de los dos, obtenida escribiendo los dos efectos seleccionados uno 
al lado del otro y luego eliminando las letras cualquiera común a ambos: ( BCD)(CDE) = BE. 
Obsérvese que si ABC y CDE se eligen para confundirse, su interacción generalizada es 
( ABC)(CDE) = ABDE de modo que ningunos efectos principales o interacciones de dos fac¬ 
tores se confundan. 

Una vez que los dos efectos definitorios hayan sido seleccionados para confundirse, un 
bloque se compone de todas las condiciones de tratamiento que tienen un número par de le¬ 
tras en común con ambos efectos definitorios. El segundo bloque se compone de todas las 
condiciones que tienen un número par de letras en común con el primer contraste definitorio 
y un número impar de letras en común con el segundo contraste y el tercero y cuarto bloques 
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se componen de los contrastes “impar/par” e “impar/impar”. En un experimento con cinco 
factores con efectos defmitorios ABC y CDE, esto da por resultado la asignación de bloques 
como se muestra en la figura 11.14 (con el número de letras en común con cada contraste de- 
fmitorio que aparece junto a cada condición experimental). 


Bloque 1 Bloque 2 Bloque 3 Bloque 4 


(1) 

(0, 0) 

ab 

(2, 0) 

de 

(0, 2) 

acd 

(2, 2) 

ace 

(2, 2) 

bcd 

(2, 2) 

bce 

(2, 2) 

abde 

(2, 2) 


d 

(0, 1) 

e 

(0, 1) 

ac 

(2, 1) 

be 

(2, 1) 

abd 

(2, 1) 

abe 

(2, 1) 

aede 

(2, 3) 

bede 

(2, 3) 


a 

(LO) 

b 

(LO) 

cd 

(L2) 

ce 

(L2) 

ade 

(1,2) 

bde 

(1,2) 

abed 

(3,2) 

abce 

(3,2) 


c 

(L 1) 

ad 

(L 1) 

ae 

(L 1) 

bd 

(L 1) 

be 

(L 1) 

abe 

(3, 1) 

ede 

(1,3) 

abede 

(3,3) 



Figura 11.14 Cuatro bloques en un experimento 2 5 factorial con efectos definitorios ABC\¡ CDE. 

El bloque que contiene (1) se llama bloque principal. Una vez construido, se puede 
obtener un segundo bloque seleccionando cualquier condición experimental no incluida en 
el bloque principal y obteniendo su interacción generalizada con cada condición presente en el 
bloque principal. Se construyen entonces los demás bloques del mismo modo seleccionan¬ 
do primero una condición no incluida en un bloque ya construido y localizando interaccio¬ 
nes generalizadas con el bloque principal. 

En situaciones experimentales con p > 3, a menudo no existe ninguna réplica, así que 
las sumas de cuadrados asociadas con interacciones de alto grado no confundidas normal¬ 
mente se agrupan a fin de obtener una suma de cuadrados para error que pueda ser utiliza¬ 
da en el denominador de los varios estadísticos F. Todos los cálculos de nuevo se realizan 
con la técnica de Yates, con SCBI como la suma de las sumas de cuadrados asociadas con 
efectos confundidos. 

Cuando r > 2, primero se selecciona r efectos definitorios que han de ser confundi¬ 
dos con bloques, asegurándose de que ninguno de los efectos elegidos sea la interacción ge¬ 
neralizada de cualesquiera otros dos seleccionados. Los 2 r — r — 1 efectos adicionales 
confundidos con los bloques son entonces interacciones generalizadas de todos los efectos pre¬ 
sentes en el conjunto definitorio (incluidas no sólo las interacciones generalizadas de pares 
de efectos sino también conjuntos de tres, cuatro y así sucesivamente). Consúltese el libro de 
Montgomery para los detalles. 



Réplica fraccionaria 

Cuando el número p de factores es grande, incluso una sola réplica de un experimento 2 P 
puede ser cara y consumidora de tiempo. Por ejemplo, una réplica de un experimento 2 6 fac¬ 
torial implica una observación por cada una de las 64 condiciones experimentales diferen¬ 
tes. Una estrategia atractiva en tales situaciones es observar sólo una fracción de las 2 P 
condiciones. Siempre que se tenga cuidado en la elección de la condición que ha de ser ob¬ 
servada, aún se puede obtener mucha información sobre efectos de factor. 

Supóngase que se decide incluir sólo 2 P ~ X (la mitad) de las 2 P condiciones posibles en 
el experimento; esto normalmente se conoce como media réplica. El precio pagado por es¬ 
te ahorro es doble. Primero, la información sobre un solo efecto (determinada por las 2 P ! 
condiciones seleccionadas para observación) se pierde por completo para el experimentador 
en el sentido de que ninguna estimación razonable del efecto es posible. Segundo, los 2 P — 2 
efectos principales e interacciones se aparean de modo que cualquier efecto en un par par¬ 
ticular se confunde con el otro efecto en el mismo par. Por ejemplo, un par como ese puede 






















cll_p397-445.qxd 3/12/08 4:27 AM Page 437 




11.4 Experimentos 2 P factoriales 437 

ser {A, BCD }, de modo que las estimaciones del efecto principal A y de la interacción BCD 
no son posibles. Es deseable, entonces, seleccionar una media réplica con la cual los efectos 
principales y las interacciones de bajo grado sean apareadas (confundidas) sólo con interac¬ 
ciones de alto grado en lugar de una con otra. 

El primer paso al seleccionar una media réplica es escoger un efecto definitorio como 
el efecto no estimable. Supóngase que en un experimento con cinco factores, ABCDE se elige 
como el efecto definitorio. Ahora las 2 5 = 32 posibles condiciones de tratamiento se divi¬ 
den en dos grupos con 16 condiciones cada uno, uno compuesto de todas las condiciones 
que tienen un número impar de letras en común con ABCDE y el otro que contiene un nú¬ 
mero par de letras en común con el contraste definitorio. Entonces cualquier grupo de 16 
condiciones se utiliza como media réplica. El grupo “impar” es 

a, b, c, d, e, abe, abd, abe, acd, ace, ade, bed, bce, bde, ede, abede 

Cada efecto principal e interacción diferente de ABCDE se confunde entonces 
con su interacción generalizada ABCDE. Por lo tanto ( AB)(ABCDE ) = CDE, de tal 
suerte que la interacción AB y la interacción CDE se confunden entre sí. Los pares 
alias resultantes son 


[A, BCDE} 

{B, ACDE} 

{C, ABDE} 

{D, ABCE} 

{E, ABCD} 

{AB, CDE} 

{AC, BDE} 

{AD, BCE} 

{AE, BCD} 

{BC, ADE} 

{BD, ACE} 

{BE, ACD} 

{ CD, ABE} 

{CE, ABD} 

{DE, ABC} 


Obsérvese en particular que cada efecto principal se confunde con una interacción de cua¬ 
tro factores. Suponiendo que estas interacciones son insignificantes se puede probar en 
cuanto a la presencia de efectos principales. 

Para seleccionar un cuarto de réplica de un experimento 2 P factorial (2 p ~ 2 de las 2 P po¬ 
sibles condiciones de tratamiento), dos efectos definitorios deben ser seleccionados. Estos 
dos y su interacción generalizada se transforman en efectos no estimables. En lugar de pa¬ 
res confundidos como en la media réplica, cada efecto restante ahora se confunde con otros 
tres efectos, y cada uno es su interacción generalizada con uno de los tres efectos no esti¬ 
mables. 

Ejemplo 11.16 El artículo “More on Planning Experiments to Increase Research Efficiency” {Industrial 
and Eng. Chemistry, 1970: 60-65) reporta sobre los resultados de un cuarto de réplica de un 
experimento 2 5 en el cual cinco factores fueron A = temperatura de condensación, B = can¬ 
tidad de material B, C = volumen de solvente, D = tiempo de condensación y E = canti¬ 
dad de material E. La variable de respuesta fue el rendimiento del proceso químico. Los 
contrastes definitorios seleccionados fueron ACE y BDE, con interacción generalizada 
(ACE)(BDE) = ABCD. Los 28 efectos principales e interacciones restantes ahora pueden 
ser divididos en siete grupos de cuatro efectos cada uno de modo que los efectos dentro 
de un grupo no pueden ser valorados por separado. Por ejemplo, las interacciones generali¬ 
zadas de A con efectos no estimables son ( A)(ACE ) = CE, ( A)(BDE) = ABDE y 
( A){ABCD ) = BCD de modo que un grupo alias es {A, CE, ABDE, BCD}. El conjunto com¬ 
pleto de grupos alias es 

{A, CE, ABDE, BCD } { B, ABCE, DE, ACD } {C, AE, BCDE, ABD ¡ 

{D, ACDE, BE, ABC} [E, AC, BD, ABCDE} {AB, BCE, ADE, CD} 

{AD, CDE, ABE, BC} ■ 

Análisis de una réplica fraccionaria Una vez que se eligen los efectos definitorios para 
un cuarto de réplica, se utilizan en la discusión de confusión para dividir las 2 P condiciones 
de tratamiento en cuatro grupos de 2 P 1 condiciones cada uno. Entonces se selecciona uno de 
los cuatro grupos como el conjunto de condiciones en las cuales los datos serán recolecta¬ 
dos. Comentarios similares aplican a una l/2 r réplica de un experimento 2 P factorial. 
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Habiendo realizado observaciones para las combinaciones de tratamiento selecciona¬ 
das, se construye una tabla de signos similar a la tabla 11.10. La tabla contiene sólo una fda 
por cada una de las combinaciones de tratamiento observadas en realidad en lugar de 2 P fdas 
y existe sólo una columna por cada grupo alias (puesto que cada efecto en el grupo tendría 
el mismo conjunto de signos en las condiciones de tratamiento seleccionadas para las obser¬ 
vaciones). Los signos en cada columna indican como siempre cómo se calculan los contras¬ 
tes para las diversas sumas de cuadrados. También se puede utilizar el método de Yates, pero 
la regla para disponer las condiciones observadas en orden estándar debe ser modificada. 

La parte difícil de análisis de réplica fraccionaria en general implica decidir cuál uti¬ 
lizar para la suma de cuadrados para error. Puesto que normalmente no habrá réplica (aun¬ 
que se podrían observar, por ejemplo, dos réplicas de un cuarto de réplica), algunas sumas 
de cuadrados para efectos deben ser agrupadas para obtener una suma de cuadrados para 
error. En una media réplica de un experimento 2 8 , por ejemplo, se puede elegir una estruc¬ 
tura alias de modo que cada uno de los ocho efectos principales y cada una de las 28 inte¬ 
racciones de dos factores se confundan sólo con interacciones de alto grado y que existan 
27 grupos alias adicionales que impliquen sólo interacciones de alto grado. Suponiendo la 
ausencia de efectos de interacción de alto grado las 27 sumas de cuadrados resultantes pueden 
entonces ser sumadas para dar una suma de cuadrados para error, lo que permite pruebas de 
un grado de libertad de todos los efectos principales e interacciones de dos factores. Sin em¬ 
bargo, en muchos casos se pueden obtener pruebas de efectos principales sólo mediante la 
agrupación de algunas o todas las sumas de cuadrados asociadas con grupos alias que im¬ 
pliquen interacciones de dos factores y las interacciones de dos factores correspondientes no 
pueden ser investigadas. 

Ejemplo 11.17 El conjunto de condiciones de tratamiento seleccionadas y los resultados del cuarto de ré- 


(continuación del 

plica del experimento 2 5 fueron 





ejemplo 11.16) 

e ab 

ad 

be 

cd ace 

bde 

abede 


23.2 15.5 

16.9 

16.2 

23.8 23.4 

16.8 

18.1 


La tabla de signos abreviada se muestra en la tabla 11.15. 




Con SCA denotando la suma de cuadrados para los efectos en el grupo alias {A, CE, 
ABDE, BCD] 

c „. (-23.2 + 15.5 + 16.9 - 16.2 - 23.8 + 23.4 - 16.8 + 18.1) 2 . „ 

SCA = - = 4.65 

8 


Tabla 11.15 Tabla de signos para el ejemplo 11.17 



A 

B 

C 

D 

E 

AB 

AD 

e 

- 

- 

- 

- 

+ 

+ 

+ 

ab 

+ 

+ 

- 

- 

- 

+ 

- 

ad 

+ 

- 

- 

+ 

- 

- 

+ 

be 

- 

+ 

+ 

- 

- 

- 

+ 

cd 

- 

- 

+ 

+ 

- 

+ 

- 

ace 

+ 

- 

+ 

- 

+ 

- 

- 

bde 

- 

+ 

- 

+ 

+ 

- 

- 

abede 

+ 

+ 

+ 

+ 

+ 

+ 

+ 



Asimismo SCB = 53.56, SCC = 10.35, SCD = 0.91, SCE' = 10.35 (el ' diferencia esta 
cantidad de la suma de cuadrados para error SCE), SCAB = 6.66 y SCAD = 3.25 y se ob¬ 
tiene STC = 4.65 + 53.56 + ■ • • + 3.25 = 89.73. Para probar en cuanto a efectos princi¬ 
pales, se utiliza SCE = SCAB + SCAD = 9.91 con 2 grados de libertad. La tabla ANOVA 
aparece en la tabla 11.16. 
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Tabla 11.16 Tabla ANOVA para el ejemplo 11.17 


Origen 

gl 

Suma de cuadrados 

Cuadrados de la media 

/ 

A 

1 

4.65 

4.65 

0.94 

B 

1 

53.56 

53.56 

10.80 

C 

1 

10.35 

10.35 

2.09 

D 

1 

0.91 

0.91 

0.18 

E 

1 

10.35 

10.35 

2.09 

Error 

2 

9.91 

4.96 


Total 

7 

89.73 





Como F 005 ¡2 = 18.51, ninguno de los cinco efectos principales puede ser juzgado signifi¬ 
cativo. Desde luego, con sólo dos grados de libertad para error, la prueba no es muy pode¬ 
rosa (es decir, es bastante probable que no detecte la presencia de efectos). El artículo de 
Industrial and Engineering Chemistry de donde se tomaron los datos en realidad daba una 
estimación independiente del error estándar de los efectos de tratamiento basado en expe¬ 
riencias previas, de modo que utilizó un análisis algo diferente. El análisis aquí realizado 
fue sólo para propósitos ilustrativos, puesto que en general se desearía mucho más de 2 gra¬ 
dos de libertad para error. ■ 

Como una alternativa de las pruebas F basadas en el agrupamiento de suma de cua¬ 
drados para obtener SCE, se puede examinar un diagrama de probabilidad normal de con¬ 
trastes de efecto. 

Ejemplo 11.18 Se realizó un experimento para investigar la contracción de material plástico utilizado para 
fundas de cables de velocímetro (“An Explanation and Critique of Taguchi’s Contribution to 
Qualtiy Engineering”, Quality and Reliability Engr., Intl., 1988: 123-131). Los ingenieros 
comenzaron con 15 factores: diámetro externo del forro, troquel de forro, material de forro, 
velocidad de la línea de forrar, tipo de trenzado del alambre, tensión de trenzado, diámetro 
del alambre, tensión del forro, temperatura del forro, material de recubrimiento, tipo de tro¬ 
quel de recubrimiento, temperatura de fusión, empaque de alambrado, método de enfriamien¬ 
to y velocidad de la línea. Se sospechaba que sólo algunos de estos factores eran importantes, 
así que se realizó un experimento de selección en la forma de un factorial 2 15 11 (una 1/2 11 
fracción de un experimento 2 15 factorial). La estructura alias resultante es bastante complica¬ 
da, en particular, cada efecto principal se confunde con interacciones de dos factores. La va¬ 
riable de respuesta fue el porcentaje de contracción de un espécimen de cable producido a 
niveles diseñados de los factores. 

La figura 11.15 muestra un diagrama de probabilidad normal de los contrastes de efec¬ 
to. Todos excepto dos de los puntos se aproximan bastante a una línea recta. Los puntos 



Contraste 



• E = Tipo de trenzado de alambre 

- 1 - 1 - 1 - 1 - 1 -► Percentil z 

- 1.6 - 0.8 0 0.8 1.6 


Figura 11.15 Diagrama de probabilidad normal de contrastes del ejemplo 11.18. 
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discrepantes corresponden a los efectos E = tipo de trenzado de alambre y G = diámetro 
del alambre, lo que sugiere que dos factores son los únicos que afectan la cantidad de con¬ 
tracción. ■ 

No se discutieron los temas de experimentación factorial, confusión y réplica fraccio- 
nal que involucran a muchos modelos y técnicas. Se debe consultar la bibliografía del capí¬ 
tulo para obtener más información. 


EJERCICIOS Sección 11.4 (38-49) 


38. Los datos adjuntos se obtuvieron con un experimento para 
estudiar la naturaleza de dependencia de la corriente de sol¬ 
dar en los tres factores: voltaje de soldar, velocidad de ali¬ 
mentación del alambre y distancia de la punta del cautín a 
la pieza de trabajo. Hubo dos niveles de cada factor (un ex¬ 
perimento 2 3 ) con dos réplicas por cada combinación de ni¬ 
veles (los promedios a través de las réplicas concuerdan con 
los valores dados en el artículo “A Study on Prediction of 
Welding Current in Gas Metal Are Welding”, J. Engr. Ma- 
nuf, 1991: 64-69). Los dos primeros números dados son 
para tratamiento (1), los dos siguientes para a y así sucesi¬ 
vamente en orden estándar: 200.0, 204.2, 215.5, 219.5, 
272.7, 276.9, 299.5, 302.7, 166.6, 172.6, 186.4, 192.0, 
232.6, 240.8, 253.4, 261.6. 

a. Verifique que las sumas de cuadrados son las que se dan 
en la tabla ANOVA adjunta generada por MINITAB. 

b. ¿Cuáles efectos parecen ser importantes y por qué? 


Analysis of Variance for current 


Source 

DF 

SS 

MS 

F 

P 

Volt 

1 

1685.1 

1685.1 

102.38 

0.000 

Speed 

1 

21272.2 

21272.2 

1292.37 

0.000 

Dist 

1 

5076.6 

5076.6 

308.42 

0.000 

Volt*speed 

1 

36.6 

36.6 

2.22 

0.174 

Volt*dist 

1 

0.4 

0.4 

0.03 

0.877 

Speed*dist 

1 

109.2 

109.2 

6.63 

0.033 

Volt*speed*dist 

1 

23.5 

23.5 

1.43 

0.266 

Error 

8 

131.7 

16.5 



Total 

15 

28335.3 





39. Los datos adjuntos se obtuvieron con un experimento 2 3 
con tres réplicas por combinación de tratamientos diseñado 
para estudiar los efectos de concentración de detergente (A), 
concentración de carbonato de sodio (S) y concentración de 
celulosa carboximetilo de sodio (C) en el poder limpiador 
de una solución en pruebas de lavado (un número grande in¬ 
dica un mejor poder limpiador que uno pequeño): 

Niveles de factor 


ABC Condición Observaciones 


1 

1 

1 

(1) 

106, 

93, 

116 

2 

1 

1 

a 

198, 

200, 

214 

1 

2 

1 

b 

197, 

202, 

185 

2 

2 

1 

ab 

329, 

331, 

307 

1 

1 

2 

c 

149, 

169, 

135 

2 

1 

2 

ac 

243, 

247, 

220 

1 

2 

2 

be 

255, 

230, 

252 

2 

2 

2 

abe 

383, 

360, 

364 


a. Tras obtener los totales de celda x ijk , calcule estimacio¬ 
nes de jSj, y A {{ y -y^i- 

b. Use los totales de celda junto con el método de Yates pa¬ 
ra calcular los contrastes de efecto y las sumas de cua¬ 
drados. Luego construya una tabla ANOVA y pruebe 
todas las hipótesis apropiadas con a = 0.05. 

40. En un estudio de procesos utilizados para eliminar impure¬ 
zas de artículos de celulosa (“Optimization of Rope-Range 
Bleaching of Cellulosic Fabrics”, Textile Research J., 1976: 
493-496), se obtuvieron los siguientes datos con un experi¬ 
mento 2 4 que implica el proceso de desencolado. Los cua¬ 
tro factores fueron concentración de enzima (A), pH (B), 
temperatura (C) y tiempo (D). 

% de almidón 

En- en P eso 


Trata¬ 

miento 

zima 

(g/L) 

pH 

Temp. 

(°C) 

Tiempo 

(hr) 

la. 

réplica 

2a. 

réplica 

(1) 

0.50 

6.0 

60.0 

6 

9.72 

13.50 

a 

0.75 

6.0 

60.0 

6 

9.80 

14.04 

b 

0.50 

7.0 

60.0 

6 

10.13 

11.27 

ab 

0.75 

7.0 

60.0 

6 

11.80 

11.30 

c 

0.50 

6.0 

70.0 

6 

12.70 

11.37 

ac 

0.75 

6.0 

70.0 

6 

11.96 

12.05 

be 

0.50 

7.0 

70.0 

6 

11.38 

9.92 

abe 

0.75 

7.0 

70.0 

6 

11.80 

11.10 

d 

0.50 

6.0 

60.0 

8 

13.15 

13.00 

ad 

0.75 

6.0 

60.0 

8 

10.60 

12.37 

bd 

0.50 

7.0 

60.0 

8 

10.37 

12.00 

abd 

0.75 

7.0 

60.0 

8 

11.30 

11.64 

cd 

0.50 

6.0 

70.0 

8 

13.05 

14.55 

acd 

0.75 

6.0 

70.0 

8 

11.15 

15.00 

bed 

0.50 

7.0 

70.0 

8 

12.70 

14.10 

abed 

0.75 

7.0 

70.0 

8 

13.20 

16.12 


a. Use el algoritmo de Yates para obtener sumas de cuadra¬ 
dos y la tabla ANOVA. 

b. ¿Parecen estar presentes efectos de interacción de segun¬ 
do, tercero y cuarto grados? Explique su razonamiento. 
¿Qué efectos principales parecen ser significativos? 

41. En el ejercicio 39, suponga que se utilizó una baja tempera¬ 
tura del agua para obtener los datos. Se repite entonces to¬ 
do el experimento con una temperatura del agua más alta 
para obtener los datos siguientes. Use el algoritmo de Yates 
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con el conjunto completo de observaciones para obtener las 
sumas de cuadrados y la tabla ANOVA y luego pruebe las hi¬ 
pótesis apropiadas al nivel 0.05. 

Condición Observaciones 


d 

144, 154, 158 

ad 

239, 227, 244 

bd 

232, 242, 246 

abd 

364, 362, 346 

cd 

194, 162, 203 

acd 

284, 295, 291 

bed 

291, 287, 297 

abed 

411,406, 395 


42. Los siguientes datos de consumo de energía en un horno 
eléctrico (kW consumidos por tonelada de producto fundi¬ 
do) se obtuvieron con un experimento factorial 2 4 con tres 
réplicas (“Studies on a 10-cwt Are Furnace”, J. Iron and 
Steel Institute, 1956: 22). Los factores fueron la naturale¬ 
za del techo A (bajo, alto), el ajuste de energía B (bajo, al¬ 
to), chatarra utilizada C (tubo, placa) y carga D (700 Ib, 
1000 Ib). 


Trata¬ 

miento 

ijklm 

Trata¬ 

miento 

^ ijklm 

(1) 

866, 862, 800 

d 

988, 808, 650 

a 

946, 800, 840 

ad 

966, 976, 876 

b 

774, 834, 746 

bd 

702, 658, 650 

ab 

709, 789, 646 

abd 

784, 700, 596 

c 

1017, 990, 954 

cd 

922, 808, 868 

ac 

1028, 906, 977 

acd 

1056, 870, 908 

be 

817, 783, 771 

bed 

798, 726, 700 

abe 

829, 806, 691 

abed 

752, 714, 714 


Construya la tabla ANOVA y pruebe todas las hipótesis de 
interés con a = 0.01. 

43. El artículo “Statistical Design and Analysis of Qualification 
Test Program for a Small Rocket Engine” (Industrial Quality 
Control, 1964: 14-18) presenta datos derivados de un expe¬ 
rimento para valuar los efectos de vibración (A), ciclaje de 
temperatura (B) ciclaje de altitud (O y temperatura para ci¬ 
claje de altitud y encendido (D) sobre duración del empuje. 
Aquí se da un subconjunto de los datos. (En el artículo, hu¬ 
bo cuatro niveles de D en lugar de sólo dos.) Use el método 
de Yates para obtener sumas de cuadrados y la tabla 
ANOVA. Luego suponga que no existen interacciones de 
tres y cuatro factores, agrupe las sumas de cuadrados corres¬ 
pondientes para obtener una estimación de cr 2 y pruebe todas 
las hipótesis apropiadas al nivel 0.05. 

D i d 2 



c. 

c 2 

Cr 

c 2 

\ 

B r 

21.60 

21.60 

11.54 

11.50 

A i 

b 2 

21.09 

22.17 

11.14 

11.32 


B r 

21.60 

21.86 

11.75 

9.82 

A-2 

b 2 

19.57 

21.85 

11.69 

11.18 


44. a. En un experimento 2 4 , suponga que se van a utilizar dos 
bloques y que se decide confundir la interacción ABCD 
con el efecto de bloque. ¿Qué tratamientos deben ser rea- 
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lizados en el primer bloque [el que contiene el tratamien¬ 
to (1)] y qué tratamientos se asignan al segundo bloque? 
b. En un experimento para investigar la retención de niaci- 
na en vegetales en función de la temperatura de cocción 
(A) tamaño de cedazo ( B ), tipo de procesamiento (C) y 
tiempo de cocción ( D ), cada factor se mantuvo a dos ni¬ 
veles. Se utilizaron dos bloques, con la asignación de 
bloques como se da en el inciso a) para confundir sólo la 
interacción ABCD con los bloques. Use el procedimien¬ 
to de Yates para obtener la tabla ANOVA para los datos 
adjuntos. 


Tratamiento 

x ijkl 

Tratamiento 

x ijkl 

(1) 

91 

d 

72 

a 

85 

ad 

78 

b 

92 

bd 

68 

ab 

94 

abd 

79 

c 

86 

cd 

69 

ac 

83 

acd 

75 

be 

85 

bed 

72 

abe 

90 

abed 

71 


c. Suponga que no existen efectos de tres vias, de modo 
que las sumas de cuadrados asociadas pueden ser com¬ 
binadas para estimar o 1 y realice todas las pruebas apro¬ 
piadas al nivel 0.05. 

45. a. Se realizó un experimento para investigar los efectos en 
la sensibilidad al audio de resistencia variable (A), dos 
capacitancias ( B , C) e inductancia de una bobina (D) en 
una parte de un circuito de televisión. Si se utilizaron 
cuatro bloques con cuatro tratamientos por bloque y los 
efectos definitorios para confusión fueron AB y CD, 
¿cuáles tratamientos aparecieron en cada bloque? 
b. Suponga que se realizaron dos réplicas del experimento 
descrito en el inciso a) y se obtuvieron los datos adjun¬ 
tos. Obtenga la tabla ANOVA y pruebe todas las hipóte¬ 
sis pertinentes al nivel 0.01. 


Trata¬ 

miento 

x ijkl\ 

x ijkl2 

Trata¬ 

miento 

X ijkll 

x ijkll 

(1) 

618 

598 

d 

598 

585 

a 

583 

560 

ad 

587 

541 

b 

MI 

525 

bd 

480 

508 

ab 

421 

462 

abd 

462 

449 

c 

601 

595 

cd 

603 

577 

ac 

550 

589 

acd 

571 

552 

be 

505 

484 

bed 

502 

508 

abe 

452 

451 

abed 

449 

455 


46. En un experimento que implica cuatro factores (A, B, C y 
D) y cuatro bloques, demuestre que por lo menos un efecto 
principal o un efecto de interacción de dos factores debe ser 
confundido con el efecto de bloque. 

47. a. En un experimento de siete factores (A,... ,G), suponga que 

en realidad se realiza un cuarto de réplica. Si los efectos de- 
finitorios son ABCDE y CDEFG, ¿cuál es el tercer efecto no 
estimable y qué tratamientos están en el grupo que 
contiene (1)? ¿Cuáles son los grupos alias de los sie¬ 
te efectos principales? 
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b. Si el cuarto de réplica se tiene que realizar con cuatro blo¬ 
ques (con ocho tratamientos por bloque), ¿cuáles son los 
bloques si los efectos a ser confundidos son ACF y BDG1 

48. Suponga que en el problema de empuje de cohete del ejer¬ 
cicio 43, estaban disponibles suficientes recursos para sólo 
una media réplica del experimento 2 4 . 

a. Si el efecto ABCD se elige como el efecto definitorio pa¬ 
ra la réplica y el grupo de ocho tratamientos para el que 
se obtienen los datos incluye el tratamiento (1), ¿qué otros 
tratamientos están en el grupo observado y en cuáles son 
los pares alias? 

b. Suponga que los resultados del experimento del inciso a) 
son los que se dan a continuación (dados en orden están¬ 
dar después de eliminar la mitad no observada). Supo¬ 
niendo que las interacciones de dos y tres factores son 
insignificantes, pruebe al nivel 0.05 en cuanto a la pre¬ 
sencia de efectos principales. También, construya un dia¬ 
grama de probabilidad normal. 

19.09 20.11 21.66 20.44 
13.72 11.26 11.72 12.29 


49. Una media réplica de un experimento 2 5 para investigar el 
efecto del tiempo de tratamiento térmico (A), tiempo de tem¬ 
ple (B), tiempo de estirado (C), posición de los serpentines 
calentadores ( D ) y posición de medición (£) en la dureza de 
piezas fundidas de acero, dio los datos adjuntos. Construya 
la tabla ANOVA y (suponiendo que las interacciones de se¬ 
gundo grado y grado más alto son insignificantes) pruebe al 
nivel 0.01 en cuanto a la presencia de efectos principales. 
Construya también un diagrama de probabilidad normal. 


Trata¬ 

miento 

Observación 

Trata¬ 

miento 

Observación 

a 

70.4 

acd 

66.6 

b 

72.1 

ace 

67.5 

c 

70.4 

ade 

64.0 

d 

67.4 

bed 

66.8 

e 

68.0 

bce 

70.3 

abe 

73.8 

bde 

67.9 

abd 

67.0 

ede 

65.9 

abe 

67.8 

abede 

68.0 


EJERCICIOS SUPLEMENTARIOS (50-61) 


50. Los resultados de un estudio de la efectividad del secado en 
tendero en la suavidad de telas se resumieron en el artículo 
“Line-Dried vs. Machine-Dried Fabrics: Comparison of 
Appearance, Hand, and Consumer Acceptance” (Home 
Econ. Research J., 1984: 27-35). Se dieron calificaciones 
de suavidad para nueve tipos distintos de telas y cinco mé¬ 
todos de secado diferentes: 1) secado en máquina, 2) seca¬ 
do colgado, 3) secado colgado seguido por 15 min de 
secado en centrífuga, 4) secado colgado con suavizante y 5) 
secado colgado con movimiento de aire. Considerando los 
diferentes tipos de tela como bloques, construya una tabla 
ANOVA. Con un nivel de significación de 0.05, pruebe pa¬ 
ra ver si hay diferencia entre la calificación de suavidad me¬ 
dia según los métodos de secado. 

Método de secado 



1 

2 

3 

4 

5 

Crepé 

3.3 

2.5 

2.8 

2.5 

1.9 

Doble punto 

3.6 

2.0 

3.6 

2.4 

2.3 

Asargada 

4.2 

3.4 

3.8 

3.1 

3.1 

Asargada combinada 

3.4 

2.4 

2.9 

1.6 

1.7 

i Tela esponja 

3.8 

1.3 

2.8 

2.0 

1.6 

Paño fino 

2.2 

1.5 

2.7 

1.5 

1.9 

Lencería para sábanas 

3.5 

2.1 

2.8 

2.1 

2.2 

Pana 

3.6 

1.3 

2.8 

1.7 

1.8 

Mezclilla 

2.6 

1.4 

2.4 

1.3 

1.6 


51. La absorción de agua de dos tipos de mortero utilizado para 
reparar cemento dañado se discutió en el artículo “Polymer 
Mortar Composite Matrices for Maintenance-Free, Highly 
Durable Ferrocement” ( J. Ferrocement, 1984: 337-345). Se 
sumergieron especímenes de mortero para cemento común 
(MCO) y mortero para cemento con polímero (MCP) du¬ 


rante lapsos de tiempo variables (5, 9, 24 o 48 horas) y se 
registró la absorción de agua (% por peso). Con el tipo de morte¬ 
ro como factor A (con dos niveles) y el periodo de inmersión co¬ 
mo factor B (con cuatro niveles), se realizaron tres 
observaciones por cada combinación de nivel de factor. Se uti¬ 
lizaron datos incluidos en el artículo para calcular las sumas de 
cuadrados, las cuales fueron SCA = 322.667, SCB = 35.623, 
SCAB = 8.557 y STC = 372.113. Use esta información para 
construir una tabla ANOVA. Pruebe las hipótesis apropiadas a 
un nivel de significación de 0.05. 


52. Se dispuso de cuatro parcelas para un experimento a fin de 
comparar la acumulación de tréboles con cuatro tipos de sem¬ 
brado (“Performance of Overdrilled Red Clover with Diffe- 
rent Sowing Rates and Initial Grazing Managements”, N. 
Zeal. J. Exp. Ag., 1984: 71-81). Como las cuatro parcelas 
habían sido rozadas de forma diferente antes del experimen¬ 
to y se pensaba que esto podía afectar la acumulación de tré¬ 
boles, se utilizó un experimento de bloques aleatorizados con 
los cuatro tipos de rozado probados en una sección de cada 
parcela. Use los datos dados para probar la hipótesis nula de 
ninguna diferencia en la acumulación de trébol media verda¬ 
dera (kg DM/ha) con los distintos tipos de sembrado. 

Coeficiente de sembrado (kg/ha) 


Parcela 



3.6 

6.6 

10.2 

13.5 

1 

1155 

2255 

3505 

4632 

2 

123 

406 

564 

416 

3 

68 

416 

662 

379 

4 

62 

75 

362 

564 


53. En proceso de control químico automático, la velocidad con 
la cual los objetos colocados sobre una banda transportadora 
pasan a través de un rociado químico (velocidad de banda. 


























Ejercicios suplementarios 443 


la cantidad de químico rociado (volumen rociado) y la mar¬ 
ca del químico utilizado (marca) son factores que pueden 
afectar la uniformidad del recubrimiento aplicado. Se con¬ 
dujo un experimento 2 3 replicado en un esfuerzo por incre¬ 
mentar la uniformidad del recubrimiento. En la tabla 
siguiente, los valores altos de la variable de respuesta están 
asociados con la alta uniformidad superficial: 


Uniformidad 

superficial 


Volumen 

Corrida de rocío 

Velocidad 

de banda 

Marca 

Réplica 

1 

Réplica 

2 

1 

- 

- 

- 

40 

36 

2 

+ 

- 

- 

25 

28 

3 

- 

+ 

- 

30 

32 

4 

+ 

+ 

- 

50 

48 

5 

- 

- 

+ 

45 

43 

6 

+ 

- 

+ 

25 

30 

7 

- 

+ 

+ 

30 

29 

8 

+ 

+ 

+ 

52 

49 


Analice estos datos y exponga sus conclusiones. 

54. Plantas de energía de carbón utilizadas en la industria eléc¬ 
trica han captado la atención del público debido a los pro¬ 
blemas ambientales asociados con los desechos sólidos 
generados por la combustión a gran escala (“Fly Ash Bin- 
ders in Stabilization of FGD Wastes”, J. of Environmental 
Engineering, 1998: 43-49). Se realizó un estudio para ana¬ 
lizar la influencia de tres factores: tipo de aglutinante (A), 
cantidad de agua (B) y escenario de disposición en la tierra 
(C), que afectan ciertas características de lixiviación de los 
desechos sólidos derivados de la combustión. Cada factor se 
estudió a dos niveles. Se realizó un experimento 2 3 no repli¬ 
cado y se midió un valor de respuesta EC50 (la concentra¬ 
ción efectiva, en mg/L, que reduce 50% de la luz en un 
bioensayo de luminiscencia) por cada combinación de nive¬ 
les de factor. Los datos experimentales se dan en la siguien¬ 
te tabla: 


Corrida 

A 

Factor 

B 

C 

Respuesta 

EC50 

1 

-1 

-1 

-1 

23100 

2 

1 

-1 

-1 

43 000 

3 

-1 

1 

-1 

71400 

4 

1 

1 

-1 

76000 

5 

-1 

-1 

1 

37 000 

6 

1 

-1 

1 

33 200 

7 

-1 

1 

1 

17 000 

8 

1 

1 

1 

16500 


Realice un ANOVA apropiado y exprese sus conclusiones. 

55. Las impurezas en la forma de óxidos de hierro reducen el 
valor económico y la utilidad de minerales industriales, ta¬ 
les como caolines, en las industrias de la cerámica y de pro¬ 
cesamiento de papel. Se realizó un experimento 2 4 para 
valuar los efectos de cuatro factores en el porcentaje de hie¬ 


rro extraído de muestras de caolín (“Factorial Experiments 
in the Development of a Kaolin Bleaching Process Using 
Thiourea in Sulphuric Acid Solutions”, Hydrometallurgy, 
1997: 181-197). Los factores y sus niveles aparecen en la si¬ 
guiente tabla: 


Factor 

Descripción 

Unidades 

Nivel 

bajo 

Nivel 

alto 

A 

h 2 so 4 

M 

0.10 

0.25 

B 

Thiourea 

g/l 

0.0 

5.0 

C 

Temperatura 

°C 

70 

90 

D 

Tiempo 

min. 

30 

150 


Los datos derivados de un experimento 2 4 no replicado se dan 
en la tabla siguiente. 


Hornada 
de prueba 

Extracción 
de hierro 

(%) 

Hornada 
de prueba 

Extracción 
de hierro 

(%) 

(1) 

7 

d 

28 

a 

11 

ad 

51 

b 

7 

bd 

33 

ab 

12 

abd 

57 

c 

21 

cd 

70 

ac 

41 

acd 

95 

be 

27 

bed 

77 

abe 

48 

abed 

99 


a. Calcule estimaciones de los efectos principales y los efec¬ 
tos de interacción de dos factores para este experimento. 

b. Cree un diagrama de probabilidad de los efectos. ¿Cuá¬ 
les efectos parecen ser importantes? 

56. Se han utilizado diseños factoriales en la silvicultura para 
valuar los efectos de varios factores en el comportamiento 
de crecimiento de árboles. En el experimento, los investiga¬ 
dores pensaban que los retoños de abetos sanos debían abo¬ 
tonar más pronto que los retoños de abetos muertos 
(“Practical Analysis of Factorial Experiments in Forestry”, 
Canadian J. of Forestry, 1995: 446-461). Además, antes de 
plantarlos, los retoños fueron expuestos a tres niveles de pH 
para ver si este factor tenía algún efecto en la captación de 
virus por las raíces. La tabla siguiente muestra datos de un 
experimento de 2 X 3 para estudiar ambos factores. 

PH 

3 5.5 7 

0 . 8 , 0 . 6 , 1 . 0 , 1 . 0 , 

0.8, 1.0, 1.2, 1.4, 

0.8 1.2 

1.0, 1.2, 1.2, 1.4, 

1.2, 1.4, 1.2, 1.2, 

1.4 1.4 

La variable de respuesta es una calificación promedio de 
cinco botones de un retoño. Las calificaciones son 0 (botón 
no abierto) 1 (botón parcialmente abierto) y 2 (botón total¬ 
mente abierto). Analice estos datos. 


Salud 


Muerto 


Saludable 


1.2, 

1.4. 

1.0, 

1-2, 

1.4 


1.4, 

1.6, 

1.6, 

1.6, 

1.4 
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57. Una propiedad de las bolsas de aire automotrices que contri¬ 
buye a su capacidad de absorber energía es la permeabilidad 
(pie 3 /pie 2 /min) del material tejido utilizado para construir las 
bolsas de aire. Entender cómo la permeabilidad es influencia¬ 
da por varios factores es importante para incrementar la efec¬ 
tividad de las bolsas de aire. En un estudio, se analizaron los 
efectos de tres factores, cada uno a tres niveles. (“Analysis of 
Fabrics used in Passive Restraint Systems-Airbags”, J. ofthe 
Textile Institute, 1996: 554-571): 

A (Temperatura): 8°C, 50°C, 75°C 
B (Denier de la tela): 420-D, 630-D, 840-D 
C (Presión del aire): 17.2 kPa, 34.4 kPa, 103.4 kPa 


Temperatura 8 o 


Denier 

17.2 

Presión 

34.4 

103.4 

420-D 

73 

157 

332 


80 

155 

322 

630-D 

35 

91 

288 


433 

98 

271 

840-D 

125 

234 

477 


111 

233 

464 

Temperatura 50° 





Presión 


Denier 

17.2 

34.4 

103.4 

420-D 

52 

125 

281 


51 

118 

264 

630-D 

16 

72 

169 


12 

78 

173 

840-D 

96 

149 

338 


100 

155 

350 

Temperatura 75° 





Presión 


Denier 

17.2 

34.4 

103.4 

420-D 

37 

95 

276 


31 

106 

281 

630-D 

30 

91 

213 


41 

100 

211 

840-D 

102 

170 

307 


98 

160 

311 


Analice estos datos y exprese sus conclusiones (suponga 
que todos los factores son fijos). 

58. Un ingeniero químico ha realizado un experimento para es¬ 
tudiar los efectos de los factores fijos en la presión de la tina 
(A), tiempo de cocción de la pulpa ( B ) y concentración de 
madera dura (C) en la resistencia del papel. El experimento 
implicó dos presiones, cuatro tiempos de cocción, tres con¬ 
centraciones y dos observaciones con cada combinación de 


estos niveles. Las sumas calculadas de los cuadrados son 
SCA = 6.94, SCB = 5.61, SCC = 12.33, SCAB = 4.05, 
SCAC = 7.32, SCBC = 15.80, SCE = 14.40 y STC = 70.82. 
Construya la tabla ANOVA y realice pruebas apropiadas a 
un nivel de significación de 0.05. 

59. Se estudió la resistencia de adhesión cuando se monta un circui¬ 
to integrado en un sustrato de vidrio metalizado como una fun¬ 
ción del factor A = tipo de adhesivo, factor B = tiempo de curado 
y factor C = material conductor (cobre y níquel). Los datos se 
dan a continuación junto con una tabla ANOVA generada por 
MINITAB. ¿Qué conclusiones puede sacar de los datos? 

Cobre Tiempo de curado 



1 

2 

3 

1 

72.7 

74.6 

80.0 

80.0 

77.5 

82.7 


77.8 78.5 84.6 


Adhesivo 

2 

75.3 


81.1 


78.3 


3 

77.3 


80.9 


83.9 


76.5 


82.6 


85.0 

Níquel 


1 


2 


3 

Adhesivo 

1 

74.7 

77.4 

79.3 


75.7 

78.2 

78.8 


77.2 

74.6 

83.0 


2 




77.8 


75.4 


83.9 


3 

77.2 


84.5 


89.4 


78.4 


77.5 


81.2 

Analysis of 

Variance 

: for strength 




Source 

DF 

SS 

MS 


F 

P 

Adhesive 

2 

101.317 

50.659 

6. 

54 

0.007 

Curetime 

2 

151.317 

75.659 

9. 

76 

0.001 

Conmater 

1 

0.722 

0.722 

0 . 

09 

0.764 

Adhes*curet 

4 

30.526 

7.632 

0 . 

98 

0.441 

Adhes*conm 

2 

8.015 

4.008 

0 . 

52 

0.605 

Curet*conm 

2 

5.952 

2.976 

0 . 

38 

0.687 

Adh*curet*conm 4 

33.298 

8.325 

1 . 

07 

0.398 

Error 

18 

139.515 

7.751 




Total 

35 

470.663 





60. El artículo “Food Consumption and Energy Requirements of 


Captive Bald Eagles” (7. Wildlife Mgmt., 1982: 646-654) in¬ 
vestigó la ingesta de energía diaria bruta media (la variable de 
respuesta) con diferentes tipos de dieta (factor A, con tres 
niveles) y temperatura (factor B, con tres niveles). Se utiliza¬ 
ron las cantidades resumidas dadas en el artículo para generar 
datos y los resultados fueron SCA = 18 138, SCB = 5182, 
SCAB = 1737, STC = 36348 y grados de libertad para 
error = 36. Construya una tabla ANOVA y pruebe las hipó¬ 
tesis pertinentes. 

61. Análogo a un cuadrado latino, se puede utilizar un diseño 
de cuadrado greco-latino cuando se sospecha que tres fac¬ 
tores externos pueden afectar las variables de respuesta y 
los cuatro factores (los tres externos y el de interés) tienen 
el mismo número de niveles. En un cuadrado latino, cada 
nivel del factor de interés (C) aparece una vez en cada fila 
(con cada nivel de A) y una vez en cada columna (con cada 
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nivel de B ). En un cuadrado greco-latino, cada nivel del factor 
D aparece una vez en cada fila, en cada columna y también 
con cada nivel del tercer factor externo C. Alternativamente, 
se puede utilizar el diseño cuando los cuatro factores son de 
igual interés, el número de niveles de cada uno es Ay están dis¬ 
ponibles recursos para sólo N 1 observaciones. Un cuadrado de 
de 5 X 5 se ilustra en a) con ( k , Z) en cada celda que denota el 
fc-ésimo nivel de C y el Z-ésimo nivel de D. En b) se presentan 
datos de pérdida de peso en barras de silicio utilizadas para 
material semiconductor como una función del volumen de gra¬ 
bado al agua fuerte (A), color del ácido nítrico en solución de 
grabado (B), tamaño de las barras (C) y tiempo en la solución 
de grabado (£>) (de ‘Applications of Analytic Techniques to the 
Semiconductor Industry”, Fourteenth Midwest Quality Con¬ 
trol Conference, 1959). 

Sea XjjfU) la pérdida de peso observada cuando el factor 
A está al nivel i, B está al nivel j, C está al nivel k y D está 
al nivel Z. Suponiendo que no hay interacción entre los fac¬ 
tores, la suma total de cuadrados STC (con N 2 — 1 grados 
de libertad) puede ser dividida en SCA, SCB, SCC, SCD y 
SCE. Dé expresiones para estas sumas de cuadrados, inclui¬ 
das las fórmulas, obtenga la tabla ANOVA de los datos da¬ 
dos y pruebe cada una de las cuatro hipótesis de efecto 
principal con a = 0.05. 
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97 
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Y) Regresión lineal simple 
y correlación 


INTRODUCCIÓN 


En los problemas de dos muestras discutidos en el capítulo 9, interesaba comparar 
valores de parámetros para la distribución x y la distribución y. Incluso cuando las ob¬ 
servaciones se aparearon, no se trató de utilizar sobre una de las variables al estudiar 
la otra variable. Éste es precisamente el objetivo del análisis de regresión, explotar la 
relación entre dos (o más) variables de modo que se pueda obtener información so¬ 
bre una de ellas mediante el conocimiento de los valores de la otra u otras. 

Gran parte de las matemáticas se dedica a estudiar variables que están deter- 
minísticamente relacionadas. Decir que x y y están relacionadas de esta manera sig¬ 
nifica que una vez conocido el valor de x, el valor de y queda completamente 
especificado. Por ejemplo, supóngase que se decide rentar una vagoneta por un día 
y la renta es de $25.00 más $0.30 por milla recorrida. Si x = el número de millas re¬ 
corridas y y = el cargo de la renta, entonces y = 25 + 0.3x. Si se recorren 100 mi¬ 
llas (x = 100), entonces y = 25 + 0.3(100) = 55. Como otro ejemplo, si la velocidad 
inicial de una partícula es v 0 y experimenta una aceleración constante a, entonces la 
distancia recorrida = y = v 0 x + \ax 2 , donde x = tiempo. 

Existen muchas variables x y y que parecerían estar relacionadas entre sí, pero 
no de una forma determinística. Un ejemplo conocido para muchos estudiantes es el 
de las variables x = promedio de calificaciones de preparatoria (GPA, por sus siglas 
en inglés) y y = GPA universitario. El valor de y no puede ser determinado sólo con 
el conocimiento de x, y dos estudiantes diferentes podrían tener el mismo valor x 
pero tener valores y muy distintos. No obstante, existe la tendencia de que aquellos 
estudiantes que tienen promedio de calificaciones de preparatoria alto (bajo) tam¬ 
bién tienen un promedio de calificaciones universitario alto (bajo). El conocimiento 
del promedio de calificaciones de preparatoria de un estudiante es bastante útil ya 
que permite predecir cómo se desempeñará en la universidad. 
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447 


Otros ejemplos de variables relacionadas de una forma no determinística inclu¬ 
yen x = edad de un niño y y = tamaño del vocabulario de ese niño, x = tamaño de 
un motor en centímetros cúbicos y y = eficiencia de combustible de un automóvil 
equipado con dicho motor y x = fuerza de tensión aplicada y y = cantidad de alarga¬ 
miento en una tira de metal. 

El análisis de regresión es la parte de la estadística que se ocupa de investigar 
la relación entre dos o más variables relacionadas en una forma no determinística. En 
este capítulo, se generaliza la relación lineal determinística y = /3 0 + j8-,x a una relación 
probabilística lineal, se desarrollan procedimientos para hacer inferencias sobre los pa¬ 
rámetros del modelo y se obtiene una medida cuantitativa (el coeficiente de correlación) 
del grado al cual las dos variables están relacionadas. En el siguiente capítulo, se conside¬ 
rarán técnicas para validar un modelo particular y para investigar relaciones no lineales 
y relaciones que implican más de dos variables. 


| 12.1 Modelo de regresión lineal simple 

La relación matemática determinística más simple entre dos variables x y y es una relación 
lineal y = /3 0 + j3jX. El conjunto de pares (x, y) para los cuales y = /3 0 + /^x determina 
una línea recta con pendiente ¡3 l e intersección en y /3 0 .* El objetivo de esta sección es 
desarrollar un modelo probabilístico lineal. 

Si las dos variables no están determinísticamente relacionadas, entonces con un valor 
fijo de x, el valor de la segunda variable es aleatorio. Por ejemplo, si se está investigando la 
relación entre la edad de un niño y el tamaño del vocabulario y se decide seleccionar un niño 
de x = 5.0 años de edad, entonces antes de hacer la selección, el tamaño del vocabulario es 
una variable aleatoria Y. Después de que un niño particular de 5 años de edad se selecciona 
y se somete a prueba, el resultado puede ser un vocabulario de 2000 palabras. Se diría en¬ 
tonces que el valor observado de Y asociado con la fijación de x = 5.0 fue y = 2000. 

Más generalmente, la variable cuyo valor fija el experimentador será denotada por x 
y se llamará variable independiente, pronosticadora o variable explicativa. Con x fija, la 
segunda variable será aleatoria; esta variable aleatoria y su valor observado se designan Y y 
y, respectivamente y se la conoce como variable dependiente o de respuesta. 

Normalmente se realizarán observaciones para varios escenarios de la variable inde¬ 
pendiente. Sean x h x 2 ,.. . ,x n los valores de la variable independiente para la que se realizan 
las observaciones y sean Y¡ y y¡, respectivamente, la variable aleatoria y el valor observado 
asociado con x¡. Los datos bivariantes disponibles se componen entonces de los n pares (x , , 
y¡), (x 2 , y 2 ), • ■ ■ , (x„, y n ). Un primer paso en el análisis de regresión que implica dos varia¬ 
bles es construir una gráfica de puntos de los datos observados. En una gráfica como esa, 
cada (x„ y¡) está representado como un punto colocado en un sistema de coordenadas bidi- 
mensional. 


La pendiente de una línea es el cambio en y con un incremento de 1 unidad en x. Por ejemplo, si y = — 3x + 10, 
entonces y se reduce en 3 cuando x se incrementa en 1, de modo que la pendiente es —3. La intersección en y 
es la altura a la cual la línea cruza el eje vertical y se obtiene haciendo x = 0 en la ecuación. 





















cl2_p446-499.qxd 3/12/08 4:30 AM Page 448 



448 CAPÍTULO 12 Regresión lineal simple y correlación 

Ejemplo 12.1 Los problemas visuales y musculoesqueléticos asociados con el uso de terminales con pan¬ 
tallas de visualización (VDT, por sus siglas en inglés) se han vuelto un tanto comunes en años 
recientes. Algunos investigadores se han enfocado en la dirección vertical de la mirada fija 
como causa del cansancio e irritación de los ojos. Se sabe que esta relación está estrechamen¬ 
te relacionada con el área de la superficie ocular (OSA, por sus siglas en inglés), así que se 
requiere un método de medir el área de la superficie ocular. Los datos representativos adjun¬ 
tos sobre y = OSA (cm z ) y x = ancho de la fisura palprebal (es decir, el ancho horizontal de 
la apertura del ojo (en cm) se tomó del artículo “Analysis of Ocular Surface Area for Com- 
fortable VDT Workstation Layout” ( Ergonomics , 1996: 877-884). No se da el orden en el 
cual se obtuvieron las observaciones, así que por conveniencia aparecen en orden creciente 
de los valores x. 



i 

i 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

X¡ 

0.40 

0.42 

0.48 

0.51 

0.57 

0.60 

0.70 

0.75 

0.75 

0.78 

0.84 

0.95 

0.99 

1.03 

1.12 

y¡ 

1.02 

1.21 

0.88 

0.98 

1.52 

1.83 

1.50 

1.80 

1.74 

1.63 

2.00 

2.80 

2.48 

2.47 

3.05 


i 

16 

17 

18 

19 

20 

21 

22 

23 

24 

25 

26 

27 

28 

29 

30 

x¡ 

1.15 

1.20 

1.25 

1.25 

1.28 

1.30 

1.34 

1.37 

1.40 

1.43 

1.46 

1.49 

1.55 

1.58 

1.60 

y¡ 

3.18 

3.76 

3.68 

3.82 

3.21 

4.27 

3.12 

3.99 

3.75 

4.10 

4.18 

3.77 

4.34 

4.21 

4.92 


Por consiguiente, {x v y : ) = (0.40, 1.02), (x 5 y 5 ) = (0.57, 1.52), y así sucesivamente. En la 
figura 12.1 se muestra una gráfica de puntos obtenida con MINITAB; se utilizó una opción 
que produjo una gráfica de puntos tanto de valores x como de valores y individualmente a lo 
largo de los márgenes derecho y superior de la gráfica, lo que facilita visualizar las distribu¬ 
ciones de las variables individuales (los histogramas o gráficas de caja son opciones alterna¬ 
tivas). He aquí algunas cosas que hay que tener en cuenta sobre los datos y la gráfica: 

• Varias observaciones tienen valores x idénticos aunque valores y diferentes (p. ej., x 8 = 
x 9 = 0.75 pero y 8 = 1.80 y y 9 = 1.74). Por lo tanto, el valor de y no está determinado só¬ 
lo por x sino también por varios otros factores. 

■ Existe una fuerte tendencia de que y se incremente a medida que x lo hace. Es decir, los 
valores grandes de OSA tienden a asociarse con valores grandes de ancho de fisura, una 
relación positiva entre las variables. 
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Ancho asociado 


Figura 12.1 Gráfica de puntos obtenida con MINITAB con los datos del ejemplo 12.1, junto 
con gráficas de puntos de valores xy y. 
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12.1 Modelo de regresión lineal simple 449 

• Parece que el valor de y podría ser pronosticado a partir de x encontrando una línea que es¬ 
té razonablemente cerca a los puntos presentes en la gráfica (los autores del artículo citado 
superponen tal línea en su gráfica). En otras palabras, existe evidencia de una relación lineal 
(aunque no perfecta) sustancial entre las dos variables. ■ 

Los ejes horizontal y vertical en la gráfica de puntos que aparecen en la gráfica de la 
figura 12.1 se cortan en el punto (0, 0). En muchos conjuntos de datos los valores de x o y 
o los valores de ambas variables difieren considerablemente de cero con respecto al rango o 
rangos de los valores. Por ejemplo, un estudio de cómo la eficiencia de un equipo de aire 
acondicionado está relacionada con la temperatura diaria máxima a la intemperie podría im¬ 
plicar observaciones de temperaturas desde 80°F hasta 100°F. Cuando éste es el caso, una 
gráfica más informativa mostraría los ejes apropiadamente marcados en algún punto dife¬ 
rente de (0, 0). 

Ejemplo 12.2 Los fenómenos de crecimiento y declinación de los bosques por todo el mundo han atraído 
un considerable interés del público y la comunidad científica. El artículo “Relationships 
Among Crown Condition, Growth, and Stand Nutrition in Seven Northern Vermont Sugar- 
bushes” (Cañad. J. ofForest Res., 1995: 386-397) incluye una gráfica de puntos de y = de¬ 
clinación de copa media (%), un indicador de la retardación del crecimiento y x = pH del 
suelo (un pH más alto corresponde a un suelo más ácido), de donde se tomaron las siguien¬ 
tes observaciones: 



X 

3.3 

3.4 

3.4 

3.5 

3.6 

3.6 

3.7 

3.7 

3.8 

3.8 

y 

7.3 

10.8 

13.1 

10.4 

5.8 

9.3 

12.4 

14.9 

11.2 

8.0 

X 

3.9 

4.0 

4.1 

4.2 

4.3 

4.4 

4.5 

5.0 

5.1 


y 

6.6 

10.0 

9.2 

12.4 

2.3 

4.3 

3.0 

1.6 

1.0 




La figura 12.2 muestra dos gráficas de puntos de estos datos obtenidas con MINITAB. En 
la figura 12.2a), MINITAB seleccionó la escala para ambos ejes. La figura 12.2b) se obtu¬ 
vo especificando valores mínimo y máximo para x y y, de modo que los ejes se corten apro¬ 
ximadamente en el punto (0, 0). La segunda gráfica está más amontonada que la primera; 
tal amontonamiento hace más difícil valorar la naturaleza general de cualquier relación. Por 
ejemplo, puede ser más difícil descubrir la curvatura en una gráfica amontonada. 



3.2 


42 


52 



pH del suelo 

a) 


pH del suelo 
b) 


Figura 12.2 Gráficas de puntos obtenidas con MINITAB con los datos del ejemplo 12.2. 
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Los valores grandes de porcentaje de declinación tienden a asociarse con un bajo pH 
del suelo, una relación negativa o inversa. Además, las dos variables parecen estar al menos 
aproximadamente relacionadas, aunque los puntos se dispersarían en torno a cualquier línea 
recta trazada a través de la gráfica. ■ 

Modelo probabilístico lineal 

Para el modelo determinístico y = j8 0 + ¡3^ el valor observado de y es una función lineal 
de x. La generalización apropiada de esto a un modelo probabilístico supone que el valor 
esperado de Y es una función lineal de x, pero que con x fija, la variable Y difiere de su va¬ 
lor esperado en una cantidad aleatoria. 


DEFINICIÓN 


Modelo de regresión lineal simple 

Existen parámetros j3 0 , /3¡ y cr 2 de tal suerte que con cualquier valor fijo de la varia¬ 
ble independiente x, la variable dependiente está relacionada con x por conducto de la 

ecuación de modelo 

Y = J3 0 + fax + e (12.1) 

La cantidad e en la ecuación de modelo es una variable aleatoria, que se supone está 
normalmente distribuida con E(e) = 0 y V(e) = a 2 . 


La variable e se conoce como término de error aleatorio o desviación aleatoria en 
el modelo. Sin e, cualquier par observado (jc, y) correspondería a un punto que queda exac¬ 
tamente sobre la línea y = ¡3 0 + ¡3 { x, llamada línea de regresión (o de población) verda¬ 
dera. La inclusión del término de error aleatorio permite que ( x , y) quede o por encima de 
la línea de regresión verdadera (cuando e > 0) o por debajo (cuando e < 0). Los puntos (jc¡, 
y,),. . . , (x n , y n ) provenientes de n observaciones independientes se dispersarán entonces en 
torno a la línea de regresión verdadera, como se ilustra en la figura 12.3. En ocasiones, la 
conveniencia del modelo de regresión lineal simple puede ser sugerida por consideraciones 
teóricas (p. ej., existe una relación lineal exacta entre las dos variables, con e representando 
el error de medición). Con mucha más frecuencia, no obstante, la racionalidad del modelo 
es indicada por una gráfica de puntos que exhibe un patrón lineal sustancial (como en la fi¬ 
gura 12.1). 



Figura 12.3 Puntos correspondientes a observaciones del modelo de regresión lineal simple. 
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12.1 Modelo de regresión lineal simple 451 

Las implicaciones de la ecuación del modelo (12.1) se entienden mejor con la ayuda 
de la siguiente notación. Sea x* un valor particular de la variable independiente x y 

Ijl y . x * = el valor esperado (o media) de Y cuando x = x* 

<Ty. x , = la varianza de Y cuando x = x* 

La notación alternativa es E(Y |x*) y E(L|x*). Por ejemplo, si x = esfuerzo aplicado 
(kg/mm 2 ) y y = tiempo para la fractura (h), entonces ¡x Y . 20 denotaría el valor esperado de 
tiempo para la fractura cuando se aplica un esfuerzo de 20 kg/mm 2 . Si se piensa en una po¬ 
blación completa de pares (x, y), entonces p Y . x , es la media de todos los valores y con los 
cuales x = x* y a Y . x » es una medida de cuántos de estos valores de y se dispersan en torno 
al valor medio. Si por ejemplo, x = edad de un niño y y = tamaño del vocabulario, enton¬ 
ces ¡jl y . 5 es el tamaño del vocabulario promedio de todos los niños de 5 años que hay en la 
población y crp. 5 describe la cantidad de variabilidad del tamaño del vocabulario de esta par¬ 
te de la población. Una vez que se fija x, la única aleatoriedad del lado derecho de la ecua¬ 
ción del modelo (12.1) se encuentra en el error aleatorio e y su valor medio y varianza son 
0 y a 2 , respectivamente, cualquiera que sea al valor de x. Esto implica que 

Pk-x* = Wo + j8iX* + e) = p 0 + ^x* + E(e) = /3 0 + P Y x* 

(Ty. x » = V(j8 0 + P l x* + e) = V(P 0 + fiiX*) + V(e) = 0 + a 2 = a 2 

Reemplazando x* en p Y . x * por x se obtiene la relación ¡x Y . x = /3 0 + /3,x, la cual expre¬ 
sa que el valor medio de Y, en lugar de Y misma, es una función lineal de x. La línea de re¬ 
gresión lineal verdadera y = J3 0 + p¡x es por consiguiente la línea de valores medios ; su 
altura por encima de cualquier valor x es el valor esperado de Y para ese valor de x. La pen¬ 
diente P 1 de la línea de regresión verdadera se interpreta como el cambio esperado de Y aso¬ 
ciado con el incremento en una unidad del valor de x. La segunda relación manifiesta que la 
cantidad de variabilidad en la distribución de valores Y es la misma con cada valor diferen¬ 
te de x (homogeneidad de varianza). En el ejemplo que implica la edad de un niño y el ta¬ 
maño de su vocabulario, el modelo implica que el tamaño del vocabulario promedio cambia 
de manera lineal con la edad (afortunadamente p , es positiva) y que la cantidad de variabi¬ 
lidad del tamaño del vocabulario a cualquier edad particular es la misma que a cualquier otra 
edad. Por último, con x fija, Y es la suma de una constante p o + P¡x y una variable aleato¬ 
ria normalmente distribuida e así que por sí misma tiene una distribución normal. Estas pro¬ 
piedades se ilustran en la figura 12.4. El parámetro de varianza o 2 determina el grado al cual 
cada curva normal se dispersa en torno a su valor medio (la altura de la línea). Cuando cr 2 



y 



b) 


Figura 12.4 a) Distribución de e; b) distribución de V'con diferentes valores de x. 
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es pequeña, un punto observado (x, y) normalmente quedará bastante cerca de la línea de re¬ 
gresión verdadera, mientras que las observaciones pueden desviarse considerablemente de 
sus valores esperados (correspondientes a puntos alejados de la línea) cuando a 2 es grande. 

Ejemplo 12.3 Supóngase que el modelo de regresión lineal simple con una línea de regresión verdadera 
y = 65 — 1.2x y cr = 8 describe la relación entre el esfuerzo aplicado x y el tiempo para la 
falla y. Entonces con cualquier valor fijo x* de esfuerzo, el tiempo para la falla tiene una 
distribución normal con valor medio de 65 — 1.2x* y desviación estándar 8. En general, 
en la población compuesta de todos los puntos (x, y), la magnitud de una desviación típica 
con respecto a la línea de regresión verdadera es aproximadamente 8. Con x = 20, Y tiene 
un valor medio ¡jl y20 = 65 — 1.2(20) = 41, por lo tanto 

j = 1 - $(1.13) = 0.1292 

La probabilidad de que el tiempo para la falla exceda de 50 cuando se aplica un esfuerzo de 
25 es, debido a que fi Y25 = 35, 

j = 1 - $(1.88) = 0.0301 

Estas probabilidades se ilustran como las áreas sombreadas en la figura 12.5. 


P(Y > 50 cuando x = 25) = P Z > 


50 


P(Y > 50 cuando x=20) = PZ> 


50 




Figura 12.5 Probabilidades basadas en el modelo de regresión lineal simple. 



Supóngase que fj denota una observación del tiempo para la falla realizada con x = 25 
y que Y 2 denota una observación independiente realizada con x = 24. Entonces fj — Y 2 está 
normalmente distribuida con valor me dio E (Y t — Y 2 ) = (3¡ = -1.2, varianza V(Y l — Y 2 ) = 
cr 2 + cr 2 = 128 y desviación estándar V128 = 11.314. La probabilidad de que fj exceda a 
L 2 es 


P(Y i - Y 2 > 0) = P Z > 


0-(-l-2) \ 
11.314 J 


P(Z> 0.11) = 0.4562 


Es decir, aun cuando se espera que Y disminuya a medida que x se incrementa en una uni¬ 
dad, es probable que Y en x + 1 sea más grande que la Y observada en x. ■ 
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EJERCICIOS Sección 12.1 (1-11) 


1. La relación de eficiencia de un espécimen de acero sumer¬ 
gido en un tanque para fosfatizar es el peso del recubri¬ 
miento de fosfato dividido entre la pérdida de metal (ambos 
en mg/pie 2 ). El artículo “Statistical Process Control of a 
Phosphate Coating Line” (Wire J. Intl., mayo de 1997: 
78-81) dio los datos adjuntos sobre la temperatura del tan¬ 
que ( x ) y relación de eficiencia (y): 


Temp. 

170 

172 

173 

174 

174 

175 

176 

Relación 

0.84 

1.31 

1.42 

1.03 

1.07 

1.08 

1.04 

Temp. 

177 

180 

180 

180 

180 

180 

181 

Relación 

1.80 

1.45 

1.60 

1.61 

2.13 

2.15 

0.84 

Temp. 

181 

182 

182 

182 

182 

184 

184 

Relación 

1.43 

0.90 

1.81 

1.94 

2.68 

1.49 

2.52 

Temp. 

185 

186 

188 





Relación 

3.00 

1.87 

3.08 






a. Construya gráficas de tallo y hojas tanto de la relación 
de temperatura como la relación de eficiencia y comen¬ 
te características interesantes. 

b. ¿Está el valor de la relación de eficiencia determinado 
por completo y de forma única por la temperatura del 
tanque? Explique su razonamiento. 

c. Construya una gráfica de puntos de los datos. ¿Parece que 
la relación de eficiencia podría ser pronosticada muy bien 
por el valor de la temperatura? Explique su razonamiento. 

2. El artículo “Exhaust Emissions from Four-Stroke Lawn Mo- 
wer Engines” ( J. ofthe Air and Water Mgmnt. Aííoc., 1997: 
945-952) reportó datos de un estudio en el cual se utilizó una 
mezcla de gasolina básica y una gasolina reformulada. Con¬ 
sidere las siguientes observaciones sobre antigüedad (años) 
y emisiones de NO,. (g/kWh): 


Motor 

1 

2 

3 

4 

5 

Antigüedad 

0 

0 

2 

11 

7 

Básica 

1.72 

4.38 

4.06 

1.26 

5.31 

Reformulada 

1.88 

5.93 

5.54 

2.67 

6.53 

Motor 

6 

7 

8 

9 

10 

Antigüedad 

16 

9 

0 

12 

4 

Básica 

0.57 

3.37 

3.44 

0.74 

1.24 

Reformulada 

0.74 

4.94 

4.89 

0.69 

1.42 

Construya gráficas de puntos de 

emisiones 

de NO^ 

contra 


antigüedad. ¿Cuál parece ser la naturaleza de la relación en¬ 
tre estas dos variables? [Nota: Los autores del artículo cita¬ 
do comentaron sobre la relación.] 

3. A menudo surgen datos bivariantes cuando se utilizan dos 
técnicas diferentes de medir la misma cantidad. Como 
ejemplo, las observaciones adjuntas de x = concentración 
de hidrógeno (ppm) por medio de un método de cromato¬ 
grafía de gases y y = concentración mediante un nuevo mé¬ 
todo de sensor se leyeron en una gráfica que aparece en el 
artículo “A New Method to Measure the Diffusible Hydro- 
gen Contení in Steel Weldments Using a Polymer Electroly- 
te-Based Hydrogen Sensor” (Welding Res., julio de 1997: 
251s-256s). 


X 

Al 

62 

65 

70 

70 

78 

95 

100 

114 

118 

y 

38 

62 

53 

67 

84 

79 

93 

106 

117 

116 

X 

124 

127 

140 

140 

140 

150 

152 

164 

198 

221 

y 

127 

114 

134 

139 

142 

170 

149 

154 

200 

215 


Construya una gráfica de puntos. ¿Parece haber una fuerte 
relación entre los dos tipos de mediciones de concentración? 
¿Parece que los métodos miden aproximadamente la misma 
cantidad? Explique su razonamiento. 

4. Un estudio para valorar la capacidad de sistemas de hume- 
decimiento de suelos mediante flujo subsuperficial para eli¬ 
minar la demanda de oxígeno bioquímico (BOD, por sus 
siglas en inglés) y varios otros constituyentes químicos dio 
los datos adjuntos sobre x = carga masiva de BOD (kg/ha/d) 
y y = eliminación masiva de BOD (kg/ha/d) (“Subsurface 
Flow Wetlands-A Performance Evaluation”, Water Envir. 
Res., 1995. 244-247). 


X 

3 

8 

10 

11 

13 

16 

27 

30 

35 

37 

38 

44 

103 

142 

y 

4 

7 

8 

8 

10 

11 

16 

26 

21 

9 

31 

30 

75 

90 


a. Construya gráficas de caja tanto de carga masiva como 
de eliminación masiva y comente sobre cualquier carac¬ 
terística interesante. 

b. Construya una gráfica de puntos de los datos y comente 
sobre cualquier característica importante. 

5. El artículo “Objective Measurement of the Stretchability of 
Mozzarella Cheese” ( J. ofTexture Studies, 1992: 185-194) 
reportó sobre un experimento para investigar la variación 
del comportamiento del queso mozzarella con la tempera¬ 
tura. Considere los datos adjuntos sobre x = temperatura 
y y = alargamiento (%) en el momento de la falla del que¬ 
so. [Nota: Los investigadores eran italianos y utilizaron queso 
mozzarella real, no el pobre primo ampliamente disponible 
en Estados Unidos.] 


X 

59 

63 

68 

72 

74 

78 

83 

y 

118 

182 

247 

208 

197 

135 

132 


a. Construya una gráfica de puntos en la cual los ejes se 
corten en (0, 0). Marque 0, 20, 40, 60, 80 y 100 en el eje 
horizontal y 0, 50, 100, 150, 200 y 250 en el eje vertical. 

b. Construya una gráfica de puntos en la cual los ejes se 
corten en (55, 100), como se hizo en el citado artículo. 
¿Parece ser preferible esta gráfica a la del inciso a)? Ex¬ 
plique su razonamiento. 

c. ¿Qué sugieren las gráficas de los incisos a) y b) sobre la 
naturaleza de la relación entre las dos variables? 

6. Un factor en la presencia del codo de tenista, una dolencia 
que provoca terror en el corazón de todos los verdaderos te¬ 
nistas, es la vibración inducida por el impacto del sistema 
raqueta y brazo al contacto con la pelota. Es bien sabido que 
la probabilidad de sufrir de codo de tenista depende de 
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varias propiedades de la raqueta utilizada. Considere la grá¬ 
fica de puntos de x = frecuencia de resonancia de la raque¬ 
ta (Hz) y y = suma de la aceleración pico a pico (una 
característica de la vibración del brazo, en m/s/s) de n = 23 
raquetas diferentes (“Transfer of Tennis Racket Vibrations 
into the Human Forearm”, Medicine and Science in Sports 
and Exercise, 1992: 1134-1140). Discuta características in¬ 
teresantes de los datos y la gráfica de puntos. 

y 

38 
36 
34 
32 
30 
28 
26 
24 
22 

100 110 120 130 140 150 160 170 180 190 

7. El artículo “Some Field Experience in the Use of an Acce- 
lerated Method in Estimating 28-Day Strength of Concrete” 
(J. Amer. Concrete Institute , 1969: 895) consideró regre¬ 
sar y = resistencia estándar después de 28 días de curado 
(lb/pulg 2 ) contra x = resistencia acelerada (lb/pulg 2 ). Su¬ 
ponga que la ecuación de la línea de regresión verdadera es 
V = 1800 + 1.3x. 

a. ¿Cuál es el valor esperado de la resistencia después de 
28 días cuando la resistencia acelerada = 2500? 

b. ¿Cuánto se debe esperar que cambie la resistencia des¬ 
pués de 28 días cuando la resistencia acelerada se incre¬ 
menta en una lb/pulg 2 ? 

c. Responda el inciso b) para un incremento de 100 lb/pulg 2 . 

d. Responda el inciso b) para una reducción de 100 
lb/pulg 2 . 

8. Recurriendo al ejercicio 7, suponga que la desviación están¬ 
dar de la desviación aleatoria e es de 350 lb/pulg 2 . 

a. ¿Cuál es la probabilidad de que el valor observado de la 
resistencia después de 28 días excederá de 5000 lb/pulg 2 
cuando el valor de la resistencia acelerada es de 2000? 

b. Repita el inciso a) con 2500 en lugar de 2000. 

c. Considere hacer dos observaciones diferentes de resis¬ 
tencia después de 28 días, la primera con una resistencia 
acelerada de 2000 y la segunda con x = 2500. ¿Cuál es 
la probabilidad de que la segunda observación excederá la 
primera por más de 1000 lb/pulg 2 ? 


d. Sean Y l y Y 2 las observaciones de resistencia después de 28 
días cuando x = x¡ y x = x 2 , respectivamente. ¿Por cuán¬ 
to tendría que exceder x 2 ax¡ para que P(Y 2 > Fj) = 0.95? 

9. La velocidad de flujo y (m 3 /min) en un dispositivo utilizado 
para medir la calidad del aire depende de la caída de presión 
x (pulg. de agua) a través del filtro del dispositivo. Suponga 
que con valores de x entre 5 y 20, las dos variables están re¬ 
lacionadas de acuerdo con el modelo de regresión lineal sim¬ 
ple con línea de regresión verdadera y = —0.12 + 0.095x. 

a. ¿Cuál es el cambio esperado de la velocidad de flujo 
asociado con un incremento de una pulg en la caída de 
presión? Explique. 

b. ¿Qué cambio de la velocidad de flujo se puede esperar 
cuando la caída de presión se reduce en cinco pulg? 

c. ¿Cuál es la velocidad de flujo esperada con una caída de 
presión de 10 pulg? ¿Una caída de presión de 15 pulg? 

d. Suponga cr = 0.025 y considere una caída de presión de 
10 pulg. ¿Cuál es la probabilidad de que el valor obser¬ 
vado de la velocidad de flujo excederá de 0.835?, ¿que 
la velocidad de flujo observada excederá de 0.840? 

e. ¿Cuál es la probabilidad de que una observación de la 
velocidad de flujo cuando la caída de presión es de 10 
pulg excederá una observación de la velocidad de flujo 
cuando la caída de presión es de 11 pulg? 

10. Suponga que el costo esperado de una serie de producción 
está relacionado con el tamaño de la serie por conducto de la 
ecuación y = 4000 + lOx. Sea Y una observación sobre el 
costo de una serie. Si el tamaño de las variables y el costo es¬ 
tán relacionados de acuerdo con el modelo de regresión lineal 
simple, podría ser el caso que P(Y > 5500 cuando x = 100) 
= 0.05 y P(Y > 6500 cuando x = 200) = 0.10? Explique. 

11. Suponga que en cierto proceso químico el tiempo de reac¬ 
ción y (h) está relacionado con la temperatura (°F) en la cá¬ 
mara en la cual la reacción ocurre de acuerdo con el modelo 
de regresión lineal simple con la ecuación y = 5.00 — O.Olx 
y o- = 0.075. 

a. ¿Cuál es el cambio esperado del tiempo de reacción con 
un incremento de un °F de la temperatura? ¿Con un in¬ 
cremento de 10°F de la temperatura? 

b. ¿Cuál es el tiempo de reacción cuando la temperatura es 
de 200°F? ¿Cuando la temperatura es de 250°F? 

c. Suponga que se realizan cinco observaciones indepen¬ 
dientemente del tiempo de reacción, cada una para una 
temperatura de 250°F. ¿Cuál es la probabilidad de que 
las cinco observaciones resulten entre 2.4 y 2.6 h? 

d. ¿Cuál es la probabilidad de que dos tiempos de reacción 
independientemente observados a temperaturas con I o 
de diferencia son tales que el tiempo a la temperatura 
más alta excede el tiempo a la temperatura más baja? 



12.2 Estimación de parámetros de modelo 


Se supondrá en ésta y en las siguientes secciones que las variables x y y están relacionadas 
de acuerdo con el modelo de regresión lineal simple. Un investigador casi nunca conocerá 
los valores de ¡3 0 , ¡3 l y a 2 . En cambio, estará disponible una muestra de datos compuesta de n 























cl2_p446-499.qxd 3/12/08 4:30 AM Page 455 



12.2 Estimación de parámetros de modelo 455 

pares observados (x¡, v,J, . . . , (x n , y n ), con la cual los parámetros de modelo y la línea 
de regresión verdadera pueden ser estimados. Se supone que estas observaciones se obtuvieron 
independientemente una de otra. Es decir, y¡ es el valor observado de una variable aleatoria Y¡, 
donde Y¡ = /3 0 + ¡5 pq + e¡ y las n desviaciones, e¡, e 2 , . . . , e n son variables independientes. 
La independencia de hj, Y 2 ,... ,Y n se desprende de la independencia de las e¡. 

De acuerdo con el modelo, los puntos observados estarán distribuidos en torno a la 
línea de regresión verdadera de una manera aleatoria. La figura 12.6 muestra una gráfica 
típica de pares observados junto con dos candidatos para la línea de regresión estimada, 
y = a 0 + ci ,x y y = b 0 + b¡x. Intuitivamente, la línea y = a 0 + a¡x no es una estimación 
razonable de la línea verdadera y = f3 0 + fi { x, porque si y = a {) + a¡x fuera la línea verda¬ 
dera, los puntos observados con toda seguridad habrían quedado más cerca de esta línea. La 
línea y = b 0 + b x x es una estimación más factible porque los puntos observados están dis¬ 
persos más cerca de esta línea. 


y 



Figura 12.6 Dos estimaciones diferentes de la línea de regresión verdadera. 


La figura 12.6 y la discusión anterior sugieren que la estimación de y = /3 0 + jS pe 
deberá ser una línea que en cierto sentido se ajuste mejor a los puntos de los datos observa¬ 
dos. Esto es lo que motiva el principio de los mínimos cuadrados, que puede ubicarse has¬ 
ta el matemático alemán Gauss (1777-1855). De acuerdo con este principio, una línea 
proporciona un buen ajuste para los datos si las distancias verticales (desviaciones) de los 
puntos observados a la línea son pequeñas (véase la figura 12.7). La medida de la bondad 
del ajuste es la suma de los cuadrados de estas desviaciones. La línea de mejor ajuste es en¬ 
tonces la que tiene la suma más pequeña posible de desviaciones al cuadrado. 


Principio de los mínimos cuadrados. 

La desviación vertical del punto ( x ¡, y¡) con respecto a la línea y = b 0 + b { x es 

la altura del punto — altura de la línea = y¡ — (b 0 + b x x¡) 

La suma de las desviaciones verticales al cuadrado de los puntos (x¡, yj,..., (x n , y n ) 
a la línea es entonces 

f(b 0 , b x ) = 2 [yi - ( b 0 + b lX¡ )] 2 
i= i 

Las estimaciones puntuales de |S 0 y /3 l5 denotadas por fí lt y /í ¡ llamadas estimaciones 
de mínimos cuadrados, son aquellos valores que reducen al mínimo a f(b 0 , b { ). Es 
decir, /3 0 y¡3 ¡ son tales que /(j6 0 , j3j) </(/;„, /;,) con cualesquier b 0 y b v La línea de 
regresión estimada o línea de mínimos cuadrados es entonces la línea cuya ecua¬ 
ción es y = j8 0 + j3 r x. 
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y 



Figura 12.7 Desviaciones de los datos observados con respecto a la línea y = b 0 + b^x. 

Los valores minimizantes de b 0 y se encuentran tomando las derivadas parciales de 
f(b 0 , b x ) con respecto tanto a b 0 como b x , igualándolas a cero [análogamente a f'(b) = 0 en 
cálculo univariante] y resolviendo las ecuaciones 



d/(ft 0 , b i) 

db 0 

df(K b \) 

db l 


l2( y¡ -b 0 - b x x¡) (-1) = 0 
Ü2 (y¡ - b 0 - b l x i )(-x i ) = 0 


La cancelación del factor —2 y reordenando se obtiene el siguiente sistema de ecuaciones, 
llamado ecuaciones normales. 

nb 0 + ( ’Zx i )b l =Zy, 

(Zxi)b 0 + (2.x¡)b i =’Zx i y ¡ 

Las ecuaciones normales son lineales en las dos incógnitas b 0 y b v Siempre que por lo me¬ 
nos dos de las x¡ sean diferentes, las estimaciones de los mínimos cuadrados son la única so¬ 
lución de este sistema. 



La estimación de los mínimos cuadrados del coeficiente de pendiente ¡3 l de la línea 
de regresión verdadera es 


h = a = = tEa 

1 1 Efe - x) 2 s„ 


( 12 . 2 ) 


Las fórmulas de cálculo para el numerador y denominador de j3[ son 


Sxy = Zxy, - (Sx,)(Zy,)/« S xx = ’Zx] - ( 'Zx¡) 2 /n 


La estimación de los mínimos cuadrados de la intersección /3 0 de la línea de regresión 
verdadera es 


b>o — Po 


n 


= y - Pix 


(12.3) 


Las fórmulas de cómputo para S y S xx requieren sólo los estadísticos resumidos Xv,- Xy,, 
Xxj, Xxy, (Xyj se requerirá en breve) y reducir al mínimo los efectos de redondeo. Al 
calcular j8 0 se utilizan dígitos adicionales en [i , porque, si x es grande en magnitud, el 
redondeo afectará la respuesta final. Se hace hincapié en que antes de calcular ^ y ¡3 0 se 
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Ejemplo 12.4 


e 



12.2 Estimación de parámetros de modelo 457 

deberá examinar una gráfica para ver si un modelo probabilístico lineal es factible. Si los pun¬ 
tos no tienden a aglomerarse en tomo a una línea recta con aproximadamente el mismo grado 
de dispersión de todas las x, se deberán investigar otros modelos. En la práctica, las gráfi¬ 
cas y cálculos de regresión normalmente se realizan con un programa de cómputo estadís¬ 
tico. 

El concreto sin finos, hecho de un agregado grueso uniformemente graduado y una pasta de 
cemento y agua, es benéfico en áreas propensas a lluvias intensas debido a sus excelentes 
propiedades de drenaje. El artículo “Pavement Thickness Design for No-Fines Concrete 
Parking Lots” U. of Transportation Engr., 1995: 476-484) empleó un análisis de mínimos 
cuadrados al estudiar cómo y = porosidad (%) está relacionada con x = peso unitario (pcf) 
en especímenes de concreto. Considere los siguientes datos representativos, mostrados en 
formato tabular conveniente para calcular los valores de los estadísticos resumidos: 


Obs 

X 

y 

X 2 

xy 

y 2 

1 

99.0 

28.8 

9 801.00 

2851.20 

829.44 

2 

101.1 

27.9 

10221.21 

2820.69 

778.41 

3 

102.7 

27.0 

10547.29 

2772.90 

729.00 

4 

103.0 

25.2 

10609.00 

2595.60 

635.04 

5 

105.4 

22.8 

11 109.16 

2403.12 

519.84 

6 

107.0 

21.5 

11 449.00 

2300.50 

462.25 

7 

108.7 

20.9 

11815.69 

2271.83 

436.81 

8 

110.8 

19.6 

12 276.64 

2171.68 

384.16 

9 

112.1 

17.1 

12 566.41 

1916.91 

292.41 

10 

112.4 

18.9 

12 633.76 

2124.36 

357.21 

11 

113.6 

16.0 

12 904.96 

1817.60 

256.00 

12 

113.8 

16.7 

12 950.44 

1900.46 

278.89 

13 

115.1 

13.0 

13 248.01 

1496.30 

169.00 

14 

115.4 

13.6 

13317.16 

1569.44 

184.96 

15 

120.0 

10.8 

14400.00 

1296.00 

116.64 

Suma 

1640.1 

299.8 

179 849.73 

32 308.59 

6430.06 



Por lo tanto x = 109.34, y = 19.986667 y 


S^, _ 32 308.59 - (1640.1)(299.8)/15 
S a “ 179 849.73 - (1640.1) 2 /15 


-471.542 

521.196 


-0.90473066 = -0.905 


/3 0 = 19.986667 - (-0.90473066)(109.34) = 118.909917 « 118.91 


Se estima que el cambio de porosidad esperado asociado con un incremento de un pcf en el 
peso unitario es de —0.905% (una reducción de 0.905%). La ecuación de la línea de regre¬ 
sión estimada (línea de mínimos cuadrados) es entonces y = 118.91 — 0.905x. La figura 
12.8 generada por el programa estadístico S-Plus, muestra que la línea de mínimos cuadra¬ 
dos proporciona un excelente resumen de la relación entre las dos variables. 
























CAPÍTULO 12 Regresión lineal simple y correlación 



Figura 12.8 Gráfica de puntos de los datos del ejemplo 12.4 con la línea de cuadrados 
mínimos superpuesta, obtenida con S-Plus. ■ 


La línea de regresión estimada puede ser utilizada de inmediato para dos propósitos 
diferentes. Con un valor fijo de x, x*, /3 0 + $ { x* (la altura de la línea sobre jc*) da 1) una es¬ 
timación puntual del valor esperado de Y cuando x = x* o 2) una predicción puntual del va¬ 
lor Y que dará por resultado una nueva observación realizada con x = x*. 

Ejemplo 12.5 Remítase a los datos de peso unitario-porosidad dados en el ejemplo anterior. Una estima¬ 
ción puntual de la porosidad promedio verdadera de todos los especímenes cuyo peso uni¬ 
tario es 110 es 

(L y .no = J3 0 + jSjUlO) = 118.91 - 0.905(110) = 19.4% 

Si se tiene que seleccionar un solo espécimen cuyo peso unitario es de 110 pcf, 19.4% tam¬ 
bién es una predicción puntual de la porosidad de este espécimen. ■ 

La línea de mínimos cuadrados no deberá ser utilizada para predecir un valor de x mu¬ 
cho más allá del rango de los datos, como x = 90 o x = 135 en el ejemplo 12.4. El peligro 
de extrapolación es que la relación ajustada (una línea en este caso) puede no ser válida 
con tales valores de x. (En el ejemplo precedente, x = 135 da y = -3.3, un valor obviamen¬ 
te ridículo de porosidad, pero la extrapolación no siempre dará por resultado semejantes in¬ 
consistencias.) 

Estimación de a 2 y a 

El parámetro a 2 determina la cantidad de variabilidad, inherente en el modelo de regresión. 
Un valor grande de cr 2 conducirá a (x¡, y¡) observados que están bastante dispersos en torno 
a la línea de regresión verdadera, mientras que cr 2 sea pequeña los puntos observados tende¬ 
rán a quedar cerca de la línea verdadera (véase la figura 12.9). Se utilizará una estimación 
de cr 2 en fórmulas de intervalos de confianza (IC) y procedimientos de prueba de hipótesis 
presentados en las dos secciones siguientes. Como la ecuación de la línea verdadera es des¬ 
conocida, la estimación se basa en el grado al cual las observaciones muéstrales se desvían 
de la línea estimada. Muchas desviaciones grandes (residuos) sugieren un valor grande de 
cr 2 , mientras que las desviaciones de pequeña magnitud sugieren que a 2 es pequeña. 
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O 


Ejemplo 12.6 
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y = Ventas de producto 



a) 


b) 


Figura 12.9 Muestra típica con o 2 : a) pequeña; b) grande. 


Los valores ajustados (o pronosticados) . . . ,y n se obtienen sustituyendo su¬ 
cesivamente x¡, . . . , x n en la ecuación de la línea de regresión estimada y¡ = 0 O + 
01*1» >2 = 0 O + 0¡x 2 , . . . ,y„ = 0 O + 0¡x n . Los residuos son las desviaciones vertica¬ 
les y l — V|, y 2 — >’ 2 , ... , y„ — y n con respecto a la línea estimada. 


En palabras, el valor pronosticado y ; es el valor de y pronosticado o esperado cuando se uti¬ 
liza la línea de regresión estimada con x = x{, y¡ es la altura de la línea de regresión estima¬ 
da por encima del valor x¡ con el cual se realizó la í-ésima observación. El residuo y¡ — y¡ es 
la diferencia entre la y¡ observada y la y¡ pronosticada. Si todos los residuos son pequeños, 
entonces mucha de la variabilidad en los valores y observados parece deberse a la relación 
lineal entre x y y , mientras que muchos residuos grandes sugieren un poco de variabilidad 
inherente en y con respecto a la cantidad debida a la relación lineal. Suponiendo que la línea 
en la figura 12.7 es la línea de mínimos cuadrados, los residuos están identificados por seg¬ 
mentos de línea verticales que parten de los puntos observados a la línea. Cuando se obtiene 
la línea de regresión estimada vía el principio de mínimos cuadrados, la suma de los residuos 
en teoría debe ser de cero. En la práctica, la suma puede desviarse un poco de cero debido al 
redondeo. 

La alta densidad de población de Japón ha provocado un sinnúmero de problemas de con¬ 
sumo de recursos. Una dificultad especialmente seria tiene que ver con la eliminación de de¬ 
sechos. El artículo “Innovative Sludge Handling Through Pelletization Thickening” (Water 
Research, 1999: 3245-3252) reportó la intervención de una nueva máquina de compresión 
para procesar lodos de albañal. Una parte importante de la investigación implicó relacionar 
el contenido de humedad de gránulos comprimidos (y, en %) con la velocidad de filtración 
de la máquina (x, en kg-DS/m/h). Los siguientes datos se tomaron de una gráfica incluida 
en el artículo: 



X 

125.3 

98.2 

201.4 

147.3 

145.9 

124.7 

112.2 

120.2 

161.2 

178.9 

y 

77.9 

76.8 

81.5 

79.8 

78.2 

78.3 

77.5 

77.0 

80.1 

80.2 

X 

159.5 

145.8 

75.1 

151.4 

144.2 

125.0 

198.8 

132.5 

159.6 

110.7 

y 

79.9 

79.0 

76.7 

78.2 

79.5 

78.1 

81.5 

77.0 

79.0 

78.6 
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Las cantidades resumidas pertinentes (estadísticos resumidos) son Ex, = 2817.9, Ey, = 
1574.8, Zx 2 = 415 949.85, Exy, = 222657.88 y Ey 2 = 124039.58, de donde 3c = 140.895, 
y = 78.74, S xx = 18 921.8295 y = 776.434. Por lo tanto 


J8r 


776.434 
18 921.8295 


0.04103377 » 0.041 


/3 0 = 78.74 - (0.04103377)(140.895) = 72.958547 * 72.96 


por lo que la ecuación de la línea de mínimos cuadrados es y = 72.96 + 0.04 lx. Para pre¬ 
cisión numérica, los valores ajustados se calcularon con y¡ = 72.958547 + 0.04103377x ; : 


^ = 72.958547 + 0.04103377(125.3) « 78.100, y, - y, « -0.200, etcétera. 


Un residuo positivo corresponde a un punto en la gráfica de puntos que queda sobre la línea de 
mínimos cuadrados, en tanto que un residuo negativo resulta de un punto localizado debajo 
de la línea. Todos los valores pronosticados (ajustes) y residuos aparecen en la tabla adjunta. 


Obs 

Filtrado 

Contenido en húmedo 

Ajuste 

Residuo 

1 

125.3 

77.9 

78.100 

-0.200 

2 

98.2 

76.8 

76.988 

-0.188 

3 

201.4 

81.5 

81.223 

0.277 

4 

147.3 

79.8 

79.003 

0.797 

5 

145.9 

78.2 

78.945 

-0.745 

6 

124.7 

78.3 

78.075 

0.225 

7 

112.2 

77.5 

77.563 

-0.063 

8 

120.2 

77.0 

77.891 

-0.891 

9 

161.2 

80.1 

79.573 

0.527 

10 

178.9 

80.2 

80.299 

-0.099 

11 

159.5 

79.9 

79.503 

0.397 

12 

145.8 

79.0 

78.941 

0.059 

13 

75.1 

76.7 

76.040 

0.660 

14 

151.4 

78.2 

79.171 

-0.971 

15 

144.2 

79.5 

78.876 

0.624 

16 

125.0 

78.1 

78.088 

0.012 

17 

198.8 

81.5 

81.116 

0.384 

18 

132.5 

77.0 

78.396 

-1.396 

19 

159.6 

79.0 

79.508 

-0.508 

20 

110.7 

78.6 

77.501 

1.099 


Casi de la misma forma en que las desviaciones de la media en una situación de una 
muestra se combinaron para obtener la estimación s 2 = E(x, — x) 2 /(n — 1), la estimación de 
a 2 en un análisis de regresión se basa en elevar al cuadrado y sumar los residuos. Se conti¬ 
nuará utilizando el símbolo s 2 para esta varianza estimada, así que no hay que confundirla 
con la í 2 previa. 


DEFINICIÓN 


La suma de cuadrados del error (o de forma equivalente, suma de cuadrados resi¬ 
duales) denotada por SCE, es 

SCE = 2(y,. - y,.) 2 = I [y,. - (/3 0 + / V ,.)] 2 


y la estimación de a 2 es 


SCE 
n — 2 


Z(y,- ~ y ¡) 2 

n — 2 
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El divisor n — 2 en s 2 es el número de grados de libertad (gl) asociado con la estimación (o, 
en forma equivalente, con la suma de cuadrados del error). Esto es porque para obtener s 2 , pri¬ 
mero se deben estimar los parámetros j3 0 y /3,, lo que hace que se pierdan 2 grados de libertad 
(exactamente como ¡jl hubo de ser estimada en problemas de una muestra, con el resultado 
de una varianza estimada basada en n — 1 grados de libertad). Reemplazando cada y¡ en la 
fórmula para s 2 con la variable aleatoria Y¡ se obtiene el estimador S 2 . Se puede demostrar que 
S 2 es un estimador insesgado de cr 2 (aunque el estimador S no es insesgado para cr). 

Ejemplo 12.7 Previamente se calcularon los residuos de los datos de contenido de humedad-velocidad de 
(continuación filtración. La suma de cuadrados del error correspondiente es 
del ejemplo 

12.6) SCE = (-0.200) 2 + (-0.188) 2 + ■ ■ • + (1.099) 2 = 7.968 

La estimación de cr 2 es ento nces ó- 2 = s 2 = 7.968/(20 — 2) = 0.4427 y la desviación están¬ 
dar estimada es cr = s = vO.4427 = 0.665. De manera aproximada, 0.665 es la magnitud 
de una desviación típica con respecto a la línea de regresión estimada. ■ 

El cálculo de SCE con la fórmula definitoria implica mucha aritmética tediosa porque 
primero se deben calcular los valores pronosticados y residuos. La siguiente fórmula de 
cómputo no requiere estas cantidades. 



SCE = Xy 2 - PoZy¡ - PiYx.y'i 


Esta expresión se obtiene al sustituir y, = /3 0 + fi l x ¡ en 2 (y,- — y ¡) 2 , elevar al cuadrado el 
sumando, realizar la suma y continuarla hasta los tres términos resultantes y simplificar. La 
fórmula de cálculo es especialmente sensible a los efectos de redondeo en /3 0 y j8,, así que 
conservar tantos dígitos como sea posible en cálculos intermedios protegerá contra errores 
de redondeo. 

Ejemplo 12,8 El artículo “Promising Quantitative Nondestructive Evaluation Techniques for Composite 
Materials” (Materials Evaluation , 1985: 561-565) reporta sobre un estudio para investigar 
cómo la propagación de una onda de esfuerzo ultrasónica a través de una sustancia depen¬ 
de de las propiedades de ésta. Los datos adjuntos sobre resistencia a la fractura (x, como por¬ 
centaje de resistencia a la tensión última) y atenuación (y, en neper/cm, la disminución de 
la amplitud de la onda de esfuerzo) en compuestos de poliéster reforzados con fibra de vi¬ 
drio se tomaron de una gráfica que aparece en el artículo. El patrón lineal sustancial que 
aparece en la gráfica de puntos sugiere el modelo de regresión lineal simple. 



X 

12 

30 

36 

40 

45 

57 

62 

67 

71 

78 

93 

94 

100 

105 

y 

3.3 

3.2 

3.4 

3.0 

2.8 

2.9 

2.7 

2.6 

2.5 

2.6 

2.2 

2.0 

2.3 

2.1 


Las cantidades resumidas necesarias son n = 14, YjX¡ = 890, Y,x 2 ¡ = 67 182, 
Ey ; = 37.6, Xyj = 103.54 y Ev,y, = 2234.30, de donde S xx = 10603.4285714, S ly = 
-155.98571429, ¡3 1 = -0.0147109 y j3 0 = 3.6209072. La fórmula de cálculo para SCE da 

SCE = 103.54 - (3.6209072)(37.6) - (-0.0147109)(2234.30) 

= 0.2624532 
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por lo tanto s 2 = 0.2624532/12 = 0.0218711 y s = 0.1479. Cuando /3 0 y /3j se redondean a 
tres cifras decimales en la fórmula de cálculo para SCE, el resultado es 

SCE = 103.54 - (3.621)(37.6) - (-0.015)(2234.30) = 0.905 

la cual es más de tres veces el valor correcto. ■ 

Coeficiente de determinación 

La figura 12.10 muestra tres gráficas de puntos diferentes de datos bivariantes. En las tres 
gráficas, las alturas de los distintos puntos varían sustancialmente, lo que indica que existe 
mucha variabilidad en los valores y observados. Todos los puntos en la primera gráfica que¬ 
dan exactamente en una línea recta. En este caso, toda la variación (100%) de y puede ser 
atribuida al hecho de que x y y están linealmente relacionadas en combinación con la varia¬ 
ción de x. Los puntos en la figura 12.10b) no quedan exactamente en una línea, pero su 
variabilidad se compara a la variabilidad total de y, las desviaciones con respecto a la línea 
de cuadrados mínimos son pequeñas. Es razonable concluir en este caso que una gran par¬ 
te de la variación de y observada puede ser atribuida a la relación lineal aproximada entre 
las variables postuladas por el modelo de regresión lineal simple. Cuando la gráfica de pun¬ 
tos es como la de la figura 12.10c), existe una variación sustancial en torno a la línea de mí¬ 
nimos cuadrados con respecto a la variación total de y, así que el modelo de regresión simple 
no explica la variación de y relacionando y con x. 


y y y 



- X - X - X 

a) b) c) 

Figura 12.10 Utilización del modelo para explicar la variación de y: a) datos con los cuales toda la 
variación es explicada; b) datos con los cuales la mayor parte de la variación es explicada; c) datos con 
los cuales poca variación es explicada. 


La suma de cuadrados SCE del error puede ser interpretada como una medida de 
cuánta variación de y permanece sin ser explicada por el modelo, es decir, cuánta no puede 
ser atribuida a una relación lineal. En la figura 12.10a), SCE = 0, y no existe ninguna va¬ 
riación no explicada, en tanto ésta sea pequeña con los datos de la figura 12.10b) y mucho 
más grande en la figura 12.10c). La suma total de los cuadrados da una medida cuantita¬ 
tiva de la cantidad de variación total en los valores y observados 

STC = S yy = 2Xy ; - y) 2 = 'Zy 2 ~ (Xv ; ) 2 /« 

La suma total de los cuadrados es la suma de las desviaciones al cuadrado con respec¬ 
to a la media muestral de los valores y observados. Por consiguiente, se resta el mismo nú¬ 
mero y de cada y¡ presente en STC, mientras que SCE implica restar cada valor diferente 
pronosticado y, de la y¡ correspondiente observada. Así como SCE es la suma de desviacio¬ 
nes al cuadrado con respecto a la línea de cuadrados mínimos v = /3 0 + ¡3 t x, STC es la 
suma de desviaciones al cuadrado con respecto a la línea horizontal a la altura y (en tal caso 
las desviaciones verticales son y¡ — y), como se ilustra en la figura 12.11. Además, como la 
suma de desviaciones al cuadrado con respecto a la línea de mínimos cuadrados es más 
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Figura 12.11 Sumas de cuadrados ilustradas: a) SCE = suma de desviaciones cuadráticas en torno 
a la línea de mínimos cuadrados; b) STC = suma de desviaciones al cuadrado en torno a la línea 
horizontal. 


pequeña que la suma de desviaciones al cuadrado con respecto a cualquier otra línea. SCE 
< STC a menos que la recta horizontal sea la recta de mínimos cuadrados. La razón 
SCE/STC es la proporción de variación total que no puede ser explicada por el modelo de 
regresión lineal simple y 1 — SCE/STC (un número entre 0 y 1) es la proporción de varia¬ 
ción de y observada y explicada por el modelo. 



DEFINICIÓN 


El coeficiente de determinación, denotado por r 2 , está dado por 


STC 

Se interpreta como la proporción de variación y observada que puede ser explicada 
por el modelo de regresión lineal simple (atribuida a una relación lineal aproximada 
entre y y x). 


Mientras más alto es el valor de r 2 , más exitoso es el modelo de regresión lineal simple 
al explicar la variación de y. Cuando se realiza un análisis de regresión mediante un programa 
de cómputo estadístico, r 2 o I OOr 2 (el porcentaje de variación explicado por el modelo) es una 
parte prominente de los resultados. Si r 2 es pequeño, un analista normalmente deseará buscar 
un modelo alternativo (como un modelo no lineal o un modelo de regresión múltiple que im¬ 
plique más de una sola variable independiente) que expbque con más eficacia la variación de y. 


Ejemplo 12.9 

(continuación 
del ejemplo 
12.4) 


La gráfica de puntos de los datos de concreto sin finos que aparece en la figura 12.8 cierta¬ 
mente pretende un valor de r 2 muy alto. Con 

j8 0 = 118.909917 /3, = -0.90473066 Zy, = 299.8 

'Zxji = 32 308.59 'Zyj = 6430.06 


se tiene 


299 8 2 

STC = 6430.06 - -— = 438.057333 = 438.06 

15 

SCE = 6430.06 - (118.909917)(299.8) - (-0.90473066)(32 308.59) 
= 11.4388 « 11.44 


El coeficiente de determinación es entonces 


r 2 = 1 — 


11.44 

438.06 


= 1 - 0.026 = 0.974 
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Esto es, 97.4% de la variación de la porosidad observada es atribuible a (puede ser explicada 
por) la relación lineal aproximada entre la porosidad y el peso unitario, un resultado muy im¬ 
presionante. (¡Muchos científicos sociales morirían por un valor de r 2 muy por encima de 0.5!) 

La figura 12.12 muestra resultados parciales generados por MIN1TAB con los datos 
de porosidad-peso unitario de los ejemplos 12.4 y 12.9; el programa también proporciona 
los valores y residuos pronosticados si se los solicita, así como también otra información. 
Los formatos utilizados por otros programas difieren un poco de los de MIN1TAB, pero 
el contenido de la información es muy similar. En la sección 12.3 se discuten cantidades 
tales como las desviaciones estándar, relaciones t y la tabla ANOVA. 


The regression equation is 
porosity = 119 — 0.905 unitwt 


k 


k 


Predictor 

Constant 

unitwt 


Coef 

118.910 

-0.90473 


/ /hStdev 
4.499 
* 0.04109 

100r 2 


t-ratio 
26.43 
- 22.02 


s = 0.9380 


R-sq =97.4% 


R-sq(adj) =97.2% 


P 

0.000 

0.000 


Analysis of Variance 


SOURCE 

DF 


SS 

Regression 

1 

426 . 

.62 

Error 

13 

11. 

.44 

Total 

14 

438. 

.06 


SCE 



STC 


Figura 12.12 Resultados obtenidos con MINITAB para la regresión de los ejemplos 12.4 y 12.9. 


El coeficiente de determinación se escribe en una forma un poco diferente al introdu¬ 
cir una tercera suma de cuadrados, suma de cuadrados debido a la regresión, SCR-dada 
por SCR = STC — SCE. La suma de cuadrados debido a la regresión se interpreta como la 
cantidad de variación total que es explicada por el modelo. En tal caso se tiene 

r 2 = 1 - SCE/STC = (STC - SCE)/STC = SCR/STC 

la relación de la variación explicada a la variación total. La tabla ANOVA que aparece en la 
figura 12.12 muestra que SCR = 426.62 de donde r 2 = 426.62/438.06 = 0.974. 

Terminología y alcance del análisis de regresión 

El término análisis de regresión lo introdujo por primera vez Francis Galton a finales del si¬ 
glo xix en conexión con su trabajo sobre la relación entre la estatura del padre x y la esta¬ 
tura del hijo y. Después de recopilar varios pares (x¡, y¡), Galton utilizó el principio de 
mínimos cuadrados para obtener la ecuación de la línea de regresión estimada con el obje¬ 
tivo de utilizarla para predecir la estatura del hijo a partir de la estatura del padre. Al utili¬ 
zar la línea derivada, Galton encontró que si la estatura del padre era por encima del 
promedio, era de esperarse que la estatura del hijo también fuera por encima del promedio, 
pero no tanto como el padre. Asimismo, el hijo de un padre con una estatura más corta que 
el promedio también tendría una estatura más corta que el promedio, pero no tanto como el 
padre. Por lo tanto, la estatura pronosticada de un hijo era “llevada de vuelta” hacia la me¬ 
dia; porque regresión significa una ida o venida. Galton adoptó la terminología línea de re¬ 
gresión. Este fenómeno de ser llevado de vuelta hacia la media ha sido observado en muchas 
otras situaciones (p. ej., promedios de bateo de un año al otro en el béisbol) y se llama efec¬ 
to de regresión. 

La discusión hasta ahora ha supuesto que la variable independiente está bajo el 
control del investigador, así que sólo la variable dependiente Y es aleatoria. Este no fue, 
sin embargo, el caso con el experimento de Galton: las estaturas de los padres no fueron 
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preseleccionadas, sino que en su lugar tanto X como Y fueron aleatorias. Se pueden aplicar 
métodos y conclusiones de análisis de regresión tanto cuando los valores de la variable in¬ 
dependiente se fijan de antemano y cuando son aleatorios, pero como las derivaciones e 
interpretaciones son más directas en el primer caso, se continuará trabajando explícitamen¬ 
te con él. Para más comentarios, véase el excelente libro de John Neter y colaboradores, 
citado en la bibliografía del capítulo. 


EJERCICIOS Sección 12.2 (12-29) 


12. El ejercicio cuatro dio datos sobre carga masiva de x = 
BOD y eliminación masiva de y = BOD. Valores de canti¬ 
dades resumidas pertinentes son 

71=14 2*,. = 517 

22 = 346 Ex? = 39095 
Ev? = 17 454 Ex¿y¡ = 25 825 

a. Obtenga una ecuación de la línea de mínimos cuadrados. 

b. Pronostique el valor de la eliminación masiva de BOD 
de una sola observación realizada cuando la carga masi¬ 
va de BOD es de 35, y calcule el valor del residuo corres¬ 
pondiente. 

c. Calcule SCE y luego una estimación puntual de cr. 

d. ¿Qué proporción de la variación observada de la elimi¬ 
nación puede ser explicada por la relación lineal aproxi¬ 
mada entre las dos variables? 

e. Los últimos dos valores de x, 103 y 142, son mucho más 
grandes que los demás. ¿Cómo se ven afectados la ecua¬ 
ción de la línea de mínimos cuadrados y el valor de r 2 
por la supresión de las dos observaciones correspon¬ 
dientes de la muestra? Ajuste los valores dados de las 
cantidades resumidas y use el hecho de que el nuevo va¬ 
lor de SCE es 311.79. 

13. Los datos adjuntos sobre x = densidad de corriente 
(mA/cm 2 ) y y = tasa de deposición (¿im/min) aparecieron 
en el artículo “Plating of 60/40 Tin/Lead Solder for Head 
Termination Metallurgy” (Plating and Surface Finishing , ene¬ 
ro de 1997: 38-40). ¿Está de acuerdo con la afirmación del 
autor del artículo de que “se obtuvo una relación lineal a par¬ 
tir de la tasa de deposición de estaño-plomo como una función 
de la densidad de corriente?” Explique su razonamiento. 


X 

20 

40 

60 

80 

y 

0.24 

1.20 

1.71 

2.22 


14. Remítase a los datos de relación de temperatura del tanque- 

eficiencia dada en el ejercicio uno. 

a. Determine la ecuación de la línea de regresión estimada. 

b. Calcule una estimación puntual de la relación eficiencia 
promedio verdadera cuando la temperatura del tanque es 
de 182. 

c. Calcule los valores de los residuos con la línea de cuadra¬ 
dos mínimos de las cuatro observaciones con las cuales 
la temperatura es de 182. ¿Por qué no todas tienen el mis¬ 
mo signo? 

d. ¿Qué proporción de la variación observada en la rela¬ 
ción de eficiencia puede ser atribuida a la relación de re¬ 
gresión lineal simple entre las dos variables? 


15. Se determinaron valores de módulo de elasticidad (MDE, la 
relación de esfuerzo, es decir, fuerza por unidad de área 
a deformación por unidad de longitud, en GPa) y resisten¬ 
cia a la flexión (una medida de la capacidad para resistir una 
falta de flexibilidad, en MPa) con una muestra de vigas de 
concreto de un cierto tipo, y se obtuvieron los siguientes da¬ 
tos (tomados de una gráfica que aparece en el artículo “Ef- 
fects of Aggregates and Microfillers on the Flexural 
Properties of Concrete”, Magazine of Concrete Research , 
1997: 81-98): 


MDE 

29.8 

33.2 

33.7 

35.3 

35.5 

36.1 

36.2 

Resistencia 

5.9 

7.2 

7.3 

6.3 

8.1 

6.8 

7.0 

MDE 

36.3 

37.5 

37.7 

38.7 

38.8 

39.6 

41.0 

Resistencia 

7.6 

6.8 

6.5 

7.0 

6.3 

7.9 

9.0 

MDE 

42.8 

42.8 

43.5 

45.6 

46.0 

46.9 

48.0 

Resistencia 

8.2 

8.7 

7.8 

9.7 

7.4 

7.7 

9.7 

MDE 

49.3 

51.7 

62.6 

69.8 

79.5 

80.0 


Resistencia 

7.8 

7.7 

11.6 

11.3 

11.8 

10.7 



a. Construya una gráfica de tallo y hojas de los valores de 
MDE y comente sobre cualquier característica interesante. 

b. ¿En el valor de resistencia se determina completa y úni¬ 
camente por el valor del MDE? Explique. 

c. Use los resultados adjuntos generados por MINITAB 
para obtener la ecuación de la línea de mínimos cuadra¬ 
dos para predecir resistencia a partir del módulo de elas¬ 
ticidad y luego para predecir resistencia de una viga 
cuyo módulo de elasticidad es de 40. ¿Se sentiría cómo¬ 
do si utiliza la línea de mínimos cuadrados para prede¬ 
cir resistencia cuando el módulo de elasticidad es de 
100? Explique. 


Predictor 

Coef 

Stdev t- 

-ratio 

P 

Constant 

3.2925 0. 

6008 

5.48 

0.000 

mod elas 

0.10748 0. 

01280 

8.40 

0.000 

s = 0.8657 

R—sg = 73.8% 

R—sq 

(adj ) 

= 72.8% 

Analysis of 

Variance 




SOURCE 

DF SS 

MS 

F 

P 

Regression 

1 52.870 

52.870 

70.55 

0.000 

Error 

25 18.736 

0.749 



Total 

26 71.605 





d. ¿Cuáles son los valores de SCE, STC y el coeficiente 
de determinación? ¿Sugieren estos valores que el mode¬ 
lo de regresión lineal simple describe de forma efectiva 
la relación entre las dos variables? Explique. 
























c!2 P446-499 .qxd 3/12/08 4:30 AM Page 466 



466 CAPITULO 12 Regresión lineal simple y correlación 

16. El artículo “Characterization of Highway Runoff in Austin, 
Texas, Area” (J. of Envir. Engr., 1998: 131-137) incluye 
una gráfica de puntos junto con una línea de cuadrados 
mínimos, de x = volumen de precipitación pluvial (m 3 ) y 
y = volumen de escurrimiento (m 3 ) en un lugar particular. 
Los valores adjuntos se tomaron de la gráfica. 


X 

5 

12 

14 17 

23 

30 

40 

47 

y 

4 

10 

13 15 

15 

25 

27 

46 

X 

55 

67 

72 

81 

96 

112 

127 

y 

38 

46 

53 

70 

82 

99 

100 


a. ¿Apoya una gráfica de puntos de los datos el uso del mo¬ 
delo de regresión lineal simple? 

b. Calcule estimaciones puntuales de la pendiente e inter¬ 
sección de la línea de regresión de la población. 

c. Calcule una estimación puntual del volumen de escu¬ 
rrimiento promedio verdadero cuando el volumen de 
precipitación pluvial es de 50. 

d. Calcule una estimación puntual de la desviación están¬ 
dar (7. 

e. ¿Qué proporción de la variación observada del volumen 
de escurrimiento puede ser atribuida a la relación de re¬ 
gresión lineal simple entre el escurrimiento y la precipi¬ 
tación pluvial? 

17. En el artículo “Use of Fly Ash or Silica Fume to Increase the 
Resistance of Concrete to Feed Acids” (Magazine of Con¬ 
crete Research , 1997: 337-344) se reportó una regresión de 
y = contenido de calcio (g/L) en x = material disuelto 
(mg/cm 2 ). La ecuación de la línea de regresión estimada fue 
y = 3.678 + 0.144x, con r 2 = 0.860 basada en n = 23. 

a. Interprete la pendiente estimada 0.144 y el coeficiente 
de determinación 0.860. 

b. Calcule una estimación puntual del contenido de calcio 
promedio verdadero cuando la cantidad de material di¬ 
suelto es de 50 mg/cm 2 . 

c. El valor de la suma total de cuadrados fue STC = 320.398. 
Calcule una estimación de la desviación estándar <x debi¬ 
do al error en el modelo de regresión lineal simple. 

18. Los siguientes estadísticos resumidos se obtuvieron con un 
estudio que utilizó análisis de regresión para investigar la 
relación entre la deflexión y la temperatura superficial del 
pavimento en varios lugares de una carretera estatal. He aquí 
x = temperatura (°F) y y = factor de ajuste por deflexión 
(y£0): 

n = 15 Zx, = 1425 Zy¡ = 10.68 
Zx) = 139 037.25 Z x¡y¡ = 987.645 
Zy) = 7.8518 

(Se realizaron más de 15 observaciones en el estudio; la re¬ 
ferencia es “Flexible Pavement Evaluation and Rehabilita- 
tion”, Transportation Eng. J., 1977: 75-85.) 

a. Calcule j8 0 y la ecuación de la línea de regresión es¬ 
timada. Trace la línea estimada. 

b. ¿Cuál es la estimación del cambio esperado del factor de 
ajuste por deflexión cuando la temperatura se incremen¬ 
ta en 1°F? 

c. Suponga que la temperatura se midió en °C en lugar de en 
°F? ¿Cuál sería la línea de regresión estimada? Respon¬ 


da el inciso b) para un incremento de 1°C. [ Sugerencia: 
°F = (9/5)°C + 32; ahora sustituya las “viejos valores x” 
en función de los “nuevos valores x”.] 

d. Si una temperatura superficial de 200°F fuera posible, 
¿utilizaría la línea estimada del inciso a) a fin de prede¬ 
cir el factor de deflexión para esta temperatura? ¿Por 
qué sí o por qué no? 

Los siguientes datos son representativos de los reportados 
en el artículo (“An Experimental Correlation of Oxides of 
Nitrogen Emissions from Power Boilers Base on Field Da¬ 
ta” (J. Eng. for Power, julio de 1973: 165-170), conx = ta¬ 
sa de liberación debido a área de quemador (MBtu/h pie 2 ) y 
y = tasa de emisión de NO x (ppm): 


X 

100 

125 

125 

150 

150 

200 

200 

y 

150 

140 

180 

210 

190 

320 

280 

X 

250 

250 

300 

300 

350 

400 

400 

y 

400 

430 

440 

390 

600 

610 

670 


a. Suponiendo que el modelo de regresión lineal simple es 
válido, obtenga la estimación de mínimos cuadrados de 
la línea de regresión verdadera. 

b. ¿Cuál es la estimación de la tasa de emisión de NO* es¬ 
perada cuando la tasa de liberación debido al área del 
quemador es igual a 225? 

c. Estime la cantidad en la cual espera que cambie la tasa 
de emisiones de NO x cuando la tasa de liberación debi¬ 
do al área del quemador disminuye en 50. 

d. ¿Utilizaría la línea de regresión estimada para predecir 
la tasa de emisión con una tasa de liberación de 500? 
¿Por qué sí o por qué no? 

Varios estudios han demostrado que los liqúenes (ciertas 
plantas compuestas de un alga y un hongo) son excelentes 
bioindicadores de la contaminación del aire. El artículo 
“The Epiphytic Lichen Hypogymnia Physodes as a Biomo- 
nitor of Atmospheric Nitrogen and Sulphur Deposition in 
Norway” {Envir. Monitoring and Assessment, 1993: 27-47) 
da los siguientes datos (tomados de una gráfica) sobre x = 
deposición de x = NO 3 en húmedo (g N/m 2 ) y y = N de li¬ 
quen (% de peso en seco): 


X 

0.05 

0.10 

0.11 

0.12 

0.31 

0.37 

0.42 

y 

0.48 

0.55 

0.48 

0.50 

0.58 

0.52 

1.02 

X 

0.58 

0.68 

0.68 

0.73 

0.85 

0.92 


y 

0.86 

0.86 

LOO 

0.88 

1.04 

1.70 



El autor utilizó regresión lineal simple para analizar los da¬ 
tos. Use los resultados obtenidos con MINITAB para res¬ 
ponder las siguientes preguntas: 

a. ¿Cuáles son las estimaciones de mínimos cuadrados de 

/3 0 y/3,? 

b. Pronostique el N de liquen con un valor de deposición 
de NO 3 de 0.5. 

c. ¿Cuál es la estimación de cr? 

d. ¿Cuál es el valor de la variación total y cuánta de ella 
puede ser explicada por la relación de modelo? 
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The regression equation is lichen 
N = 0.365 + 0.967 no3 depo 


Predictor 

Constant 
no3 depo 

Coef 

0.36510 0. 

0.9668 0 

Stdev 

09904 

.1829 

t-ratio 

3.69 

5.29 

P 

0.004 

0.000 

s = 0.1932 

R-sg =71.7% 

R-sq 

(adj) =69. 

.2% 

Analysis of 

Variance 




SOURCE 

Regression 

Error 

Total 

DF SS 

1 1.0427 

11 0.4106 

12 1.4533 

MS 

1.0427 

0.0373 

F 

27.94 

P 

0.000 


21. El ángulo de recuperación de arrugas y la resistencia a la 
tensión son las dos características más importantes para eva¬ 
luar el desempeño de tela de algodón entrelazada. Un incre¬ 
mento en el ángulo de entrelazado, determinado por la 
absorbencia de una banda de áster carboxilo, mejora la resis¬ 
tencia a las arrugas de la tela (a expensas de la reducción de 
la resistencia mecánica). Los datos adjuntos sobre x = ab¬ 
sorbencia y y = resistencia al ángulo de arrugamiento se to¬ 
maron de una gráfica incluida en el artículo "Predicting the 
Performance of Durable Press Finished Cotton Fabric with 
Infrared Spectroscopy” (Textile Res. J ., 1999: 145-151). 


X 

0.115 0.126 0.183 0.246 0.282 0.344 0.355 0.452 0.491 0.554 0.651 

y 

334 342 355 363 365 372 381 392 400 412 420 


He aquí los resultados obtenidos con MINITAB. 


Predictor Coef 

SE Coef 

T 

P 

Constant 321. 

878 

2.483 

129.64 0 

.000 

absorb 156. 

711 

6.464 

24.24 0 

. 000 

S = 3.60498 R 

-Sq 

= 98.5% 

R-Sq(adj) 

= 98.3% 

Source 

DF 

SS 

MS 

F P 

Regression 

1 

7639.0 7639.0 587. 

81 0.000 

Residual Error 

9 

117.0 

13.0 


Total 

10 

7756.0 




a. ¿Parece ser apropiado el modelo de regresión lineal sim¬ 
ple? Explique. 

b. ¿Qué ángulo de resistencia a las arrugas pronosticaría 
para un espécimen de tela cuya absorbencia es de 0.300? 

c. ¿Cuál sería la estimación del ángulo de resistencia a las 
arrugas cuando la absorbencia es de 0.300? 

22. a. Use las cantidades del ejercicio 18 para estimar la des¬ 

viación estándar de la desviación aleatoria e en el mode¬ 
lo de regresión lineal simple. 

b. Basado en las cantidades del ejercicio 18, ¿qué propor¬ 
ción de la variación del factor de ajuste por deflexión 
puede ser explicado por la relación de regresión lineal 
simple entre el factor de ajuste y la temperatura? 

23. a. Obtenga la SCE con los datos del ejercicio 19 a partir de 

la fórmula definitoria [SCE = £(y. — y,.) 2 ] y compare 
con el valor calculado con la fórmula de cómputo. 


12.2 Estimación de parámetros de modelo 467 

b. Calcule el valor de la suma total de los cuadrados. ¿Ex¬ 
plica el modelo de regresión lineal la variación de la tasa 
de emisiones? Justifique su aseveración. 

24. Los datos adjuntos se tomaron de una gráfica que apareció 
en el artículo “Reactions on Painted Steel Under the Influen- 
ce of Sodium Chloride, and Combinations Thereof’ (Ind. 
Engr. Chem. Prod. Res. Dev. 1985: 375-378). La variable in¬ 
dependiente es la tasa de deposición de S0 2 (mg/m 2 /d) y la 
variable independiente es pérdida de peso de acero (g/m 2 ). 


X 

14 

18 

40 

43 

45 

112 

y 

280 

350 

470 

500 

560 

1200 


a. Construya una gráfica de puntos. ¿Parece razonable la 
regresión lineal simple en esta situación? 

b. Calcule la ecuación de la línea de regresión estimada. 

c. ¿Qué porcentaje de la variación observada en la pérdida de 
peso del acero puede ser atribuido a la relación de modelo 
en combinación con la variación de la tasa de deposición? 

d. Debido a que el valor x más grande en la muestra exce¬ 
de en gran medida a los demás, esta observación puede 
haber influido mucho al determinar la ecuación de la lí¬ 
nea estimada. Elimine esta observación y recalcule la 
ecuación. ¿Difiere la nueva ecuación sustancialmente de 
la original (podría considerar valores pronosticados)? 

25. Compruebe que b 1 y b 0 de las expresiones (12.2) y (12.3) 
satisfacen las ecuaciones normales. 

26. Demuestre que el “punto de promedios” ( x , y) queda en la 
línea de regresión estimada. 

27. Suponga que un investigador cuenta con datos sobre la can¬ 
tidad de espacio de anaquel x dedicado a la exhibición de un 
producto particular y a ingresos por ventas y de ese produc¬ 
to. Es posible que el investigador desee adoptar un modelo 
para el cual la línea de regresión verdadera pase a través de 
(0, 0). El modelo apropiado es Y = fi x x + e. Suponga que 
(x v y¡), . . . , ( x n , y n ) son pares observados generados con 
este modelo y deduzca el estimador de mínimos cuadrados 
de /3j. [ Sugerencia: Escriba la suma de desviaciones al cua¬ 
drado como una función de ¿q, un valor de prueba y use el 
cálculo para determinar el valor minimizante de b v \ 

28. a. Considere los datos del ejercicio 20. Suponga que en lu¬ 

gar de la línea de mínimos cuadrados que pasa por los 
puntos (jCj, y¡), . . . , ( x n , y„), se desea que pase por ( x 1 — 
x, y¡), ..., (x n — x, y„). Construya una gráfica con los 
puntos (x¡, y,) y luego con los puntos (x¡ — x, y¡). Use las 
gráficas para explicar intuitivamente cómo están relacio¬ 
nadas entre sí las dos líneas de mínimos cuadrados, 
b. Suponga que en lugar del modelo Y¡ = J3 0 + /El + 
e¡ (i = 1 , . . . , n), se desea ajustar un modelo de la for¬ 
ma Y¡ = /3q + /3 *(x¡ — x) + e¡ (i = 1, . . . , ri). ¿Cuáles 
son los estimadores de mínimos cuadrados de j6 q y /3 *, 
y cómo están relacionados con /3 0 y fí{! 

29. Considere los siguientes tres conjuntos de datos, en los cua¬ 
les las variables de interés son x = distancia de la casa al 
trabajo y y = tiempo para recorrer la distancia de la casa 
al trabajo. Basado en una gráfica de puntos y los valores de 
syr 2 , ¿en qué situación la regresión lineal simple sería más 
(menos) efectiva y por qué? 
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Conjunto de datos 

1 


2 


3 

S„ 

17.50 

1270.8333 

1270.8333 








29.50 

2722.5 

1431.6667 

X 

y 

X 

y 

X 

y 

Pi 

1.685714 

2.142295 

1.126557 







Po 

13.666672 

7.868852 

3.196729 

1 J 


J 

lo 

J 

o 

STC 

114.83 

5897.5 

1627.33 


35 

10 

32 

10 












SCE 

65.10 

65.10 

14.48 

17 

45 

15 

44 

15 

22 





18 

42 

20 

45 

20 

23 





19 

49 

25 

63 

25 

31 





20 

46 

50 

115 

50 

60 






12.3 Inferencias sobre el parámetro de pendiente jS-, 

En virtualmente todo el trabajo inferencial realizado hasta ahora, la noción de variabilidad 
de muestreo ha sido persistente. En particular, las propiedades de las distribuciones de 
muestreo de varios estadísticos han sido la base para desarrollar fórmulas de intervalo de con¬ 
fianza y métodos de prueba de hipótesis. La idea clave en este caso es que el valor de virtual¬ 
mente cualquier cantidad calculada a partir de datos muéstrales, el valor de virtualmente 
cualquier estadístico, va a variar de una muestra a otra. 


Ejemplo 12.10 Reconsidere los datos sobre x = tasa de liberación debido al área del quemador y y = tasa 
de emisiones de NO x del ejercicio 12.19 en la sección previa. Existen 14 observaciones, 
realizadas con los valores x: 100, 125, 125, 150, 150, 200, 200, 250, 250, 300, 300, 350, 400 
y 400, respectivamente. Suponga que la pendiente e intersección de la línea de regresión 
verdadera son ¡3 l = 1.70 y /3 0 = —50 con cr = 35 (consistente con los valores /3 X = 1.7114, 
/3 0 = -45.55, s = 36.75). Se procede a generar una muestra de desviaciones aleatorias 
ej, . . ., ej 4 con respecto a una distribución normal con media 0 y desviación estándar 35 y 
luego se sumó e, a /3 0 + ¡3 l x l para obtener 14 valores y correspondientes. Se realizaron en¬ 
tonces los cálculos de regresión para obtener la pendiente, la intersección y la desviación 
estándar estimadas. Este proceso se repitió un total de 20 veces y los valores resultantes se 
dan en la tabla 12.1. 


Tabla 12.1 Resultados de simulación del ejemplo 12.10 











Pi 

Po 

s 


Pi 

Po 

s 

1 . 

1.7559 

-60.62 

43.23 

11 . 

1.7843 

-67.36 

41.80 

2 . 

1.6400 

-49.40 

30.69 

12 . 

1.5822 

-28.64 

32.46 

3. 

1.4699 

-4.80 

36.26 

13. 

1.8194 

-83.99 

40.80 

4. 

1.6944 

-41.95 

22.89 

14. 

1.6469 

-32.03 

28.11 

5. 

1.4497 

5.80 

36.84 

15. 

1.7712 

-52.66 

33.04 

6 . 

1.7309 

-70.01 

39.56 

16. 

1.7004 

-58.06 

43.44 

7. 

1.8890 

-95.01 

42.37 

17. 

1.6103 

-27.89 

25.60 

8 . 

1.6471 

-40.30 

43.71 

18. 

1.6396 

-24.89 

40.78 

9. 

1.7216 

-42.68 

23.68 

19. 

1.7857 

-77.31 

32.38 

10 . 

1.7058 

-63.31 

31.58 

20 . 

1.6342 

-17.00 

30.93 


Claramente existe variación en los valores de la pendiente y la intersección estimadas, 
así como también la desviación estándar estimada. La ecuación de la línea de cuadrados mí¬ 
nimos varía por lo tanto de una muestra a la siguiente. La figura 12.13 muestra una gráfica 
de puntos de las pendientes estimadas así como también gráficas de la línea de regresión 
verdadera y las 20 líneas de regresión muéstrales. 
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H-^- *T. I • -H 

1.5 1.6 1.7 1.8 1.9 

Pendiente ^ 

Pl 

a) 





Figura 12.13 Resultados de simulación del ejemplo 12.10: a) gráfica de puntos de pendientes 
estimadas; b) gráficas de la línea de regresión verdadera y 20 líneas de mínimos cuadrados obtenidas 
con S-Plus. ■ 


La pendiente j8, de la línea de regresión de la población es el cambio promedio ver¬ 
dadero en la variable dependiente y asociada con un incremento de una unidad en la varia¬ 
ble independiente x. La pendiente de la línea de mínimos cuadrados /3 h da una estimación 
puntual de /3 ( . Del mismo modo que un intervalo de confianza para ¡jl y los procedimientos 
para probar hipótesis con respecto a ¡jl se basaron en propiedades de la distribución de mues- 
treo de X, las inferencias adicionales sobre /3¡ están basadas en considerar a /3 como un 
estadístico e investigar su distribución de muestreo. 

Se supone que los valores de las x¡ se eligen antes de realizar el experimento, así que 
sólo las Y¡ son aleatorias. Los estimadores (estadísticos, y por lo tanto variables aleatorias) 
de j8 0 y f3 l se obtienen reemplazando y¡ por Y¡ en (12.2) y (12.3): 

2( X¡ - *)(Y,. - Y) 

l(x, ~ x) 2 


/ 3 , 

A , 


n 
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Asimismo, el estimador de a 2 se obtiene al reemplazar cada y¡ en la fórmula para s 2 por la 
variable aleatoria Y¡\ 


’Zyj-0 o Zy-$ 1 'Zx ¡ y ¡ 

n — 2 


El denominador de /3,, S xx = Y(x¡ — x) 2 , depende sólo de las x¡ y no de las Y¡, así que es una 
constante. Entonces como Y(x¡ — x)Y = YY (x¡ — x) = Y • 0 = 0, el estimador de la pen¬ 
diente se escribe como 


/3, 


lA - x)Y¡ 


= IctY, 


donde c¡ = (x ; — x)/S xx 


Es decir, /3, es una función lineal de variables aleatorias independientes K h Y 2 , , Y n , 

cada una de las cuales está normalmente distribuida. Invocando las propiedades de una fun¬ 
ción lineal de variables aleatorias discutidas en la sección 5.5 conduce a los siguientes 
resultados. 



1. El valor medio de /3j es E(fí^) = p,^ = /3,, así que /3 1; es un estimador insesgado 
de /3j (la distribución de /3¡ siempre está centralizada en el valor de ¡6¡). 

2. La varianza y desviación estándar de /3¡ son 

y (A) = oi -= £ ^ (12.4) 

donde S xx = Y(x l — x) 2 = Yxj — (Yx¡) 2 /n. Reemplazando crpor su estimación .v da 
una estimación para cr^ (la desviación estándar estimada, es decir, el error están¬ 
dar estimado, de ¡3 X ): 

s 


(Esta estimación también puede ser denotada por 

3. El estimador /3 ¡ tiene una distribución normal (porque es una función lineal de va¬ 
riables aleatorias independientes). 



De acuerdo con (12.4), la varianza de /3[ es igual a la varianza a 2 del término de error alea¬ 
torio, o, en forma equivalente, de cualquier Y¡, dividida entre Y(x¡ — x) 2 . Como Y(x¡ — x) 2 
mide la dispersión de las x¡ en torno a x, se concluye que si realizan observaciones a valo¬ 
res x¡ que están bastante dispersos se obtiene un estimador más preciso del parámetro de 
pendiente (varianza más pequeña de ^), mientras que los valores de x¡ muy cercanos entre 
sí implican un estimador altamente variable. Desde luego, si las x¡ están demasiado disper¬ 
sas, un modelo lineal puede no ser apropiado a lo largo del rango de observación. 

Muchos procedimientos inferenciales previamente discutidos se basaron en estanda¬ 
rizar un estimador restando primero su valor medio y luego dividiéndolo entre su desviación 
estándar estimada. En particular, los procedimientos de prueba y un intervalo de confianza 
para p, media de una población normal utilizaron el hecho de que la variable estandarizada 
(X - p,)/(S/Vñ), es decir, (X — p-)/^, tenía una distribución t con n — 1 grado de libertad. 
Un resultado similar en este caso abre la puerta a más inferencias sobre j8,. 
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Ejemplo 12.11 
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La suposición del modelo de regresión lineal simple implica que la variable estándar 

T= Pi-Pi - ¿i-fii 

s/Vs a s fil 

tiene una distribución t con n — 2 grados de libertad. 


Un intervalo de confianza para j8 1 

Como en la derivación de intervalos de confianza previos, se inicia con el enunciado de pro¬ 
babilidad 


p(_ , Pi Pi \ _ , _ 

Py 4/2, n-2 ^ 4/2,n—2^ 1 a 

La manipulación de las desigualdades entre los paréntesis para aislar ¡3 l y la sustitución de 
las estimaciones en lugar de los estimadores da la fórmula del intervalo de confianza. 


Un intervalo de confianza de 100(1 — a)% para la pendiente /3, de la línea de re¬ 
gresión verdadera es 

Pl — 4 / 2,«-2 ‘ S ji¡ 


O 


Este intervalo tiene la misma forma general de muchos de los intervalos previos. Está cen¬ 
trado en la estimación puntual del parámetro y la cantidad que se extiende a cada lado de la 
estimación depende del nivel de confianza deseado (a través del valor crítico t) y de la can¬ 
tidad de variabilidad del estimador 0¡ (a través de sy h , el cual tenderá a ser más pequeño 
cuando existe poca variabilidad en la distribución de y grande de lo contrario). 

Las variaciones del peso de mampostería de ladrillos de arcilla tienen implicaciones no sólo 
para diseño estructural y acústico sino también para el diseño de sistemas de calefacción, 
ventilación y aire acondicionado. El artículo “Clay Brick Masonry Weight Variation” (J. of 
Architectural Engr., 1996: 135-137) incluye una gráfica de puntos de y = densidad de mor¬ 
tero en seco (lb/pie 3 ) contra x = contenido de aire del mortero (%) para una muestra de es¬ 
pecímenes de mortero, de donde se tomaron los siguientes datos representativos: 


X 

5.7 

6.8 

9.6 

10.0 

10.7 

12.6 

14.4 

15.0 

15.3 

y 

119.0 

121.3 

118.2 

124.0 

112.3 

114.1 

112.2 

115.1 

111.3 

X 

16.2 

17.8 

18.7 

19.7 

20.6 

25.0 




y 

107.2 

108.9 

107.8 

111.0 

106.2 

105.0 





La gráfica de puntos de estos datos en la figura 12.14 ciertamente sugiere la pertinencia del 
modelo de regresión lineal simple; parece haber una sustancial relación lineal negativa en¬ 
tre el contenido de aire y la densidad, una en la cual la densidad tiende a incrementarse a 
medida que se incrementa el contenido de aire. 
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Densidad 


125 


115 


105 


L 


L 


L 


Contenido de aire 


5 15 25 

Figura 12.14 Gráfica de puntos de los datos del ejemplo 12.11. 


Los valores de los estadísticos resumidos requeridos para calcular las estimaciones de 
los mínimos cuadrados son 

= 218.1 'Zy i = 1693.6 = 3577.01 

5Xv¡ = 24 252.54 Zyj = 191672.90 

con las cuales se obtuvieron S xy = -372.404, S xx = 405.836, /3¡ = -0.917622, /3 0 = 
126.248889, STC = 454.1693, SCE = 112.4432 y r 2 = 1 - 112.4432/454.1693 = 0.752. 
Aproximadamente 75% de la variación de la densidad observada puede ser atribuido a la 
relación de modelo de regresión lineal simple entre la densidad y el contenido de aire. El 
grado de libertad debido al error es 15 — 2 = 13, para obtener s 2 = 112.4432/13 = 8.6495 
y s = 2.941. 

La desviación estándar estimada de j8[ es 

5 2.941 

íó = — 7= = — / ■ - = 0.1460 

VS^ V405.836 

El valor crítico total t para un nivel de confianza de 95% es í 0025 13 = 2.160. El intervalo de 
confianza es 


-0.918 ± (2.160X0.1460) = -0.918 ± 0.315 = (-1.233, -0.603) 

Con un alto grado de confianza, se estima que una disminución promedio de la densidad 
de entre 0.603 lb/pie 3 y 1.233 lb/pie 3 está asociada con 1% de incremento del contenido de 
aire (por lo menos con valores de contenido de aire entre aproximadamente 5% y 25%, co¬ 
rrespondientes a los valores x en una muestra). El intervalo es razonablemente angosto, lo 
que indica que la pendiente de la línea de población fue estimada con precisión. Obsérvese que 
el intervalo incluye sólo valores negativos, así que se puede estar seguro de la tendencia de 
la densidad a disminuir conforme el contenido de aire se incrementa. 

Examinando los resultados obtenidos con SAS de la figura 12.15, se encuentra el va¬ 
lor de bajo Estimaciones de parámetro como el segundo número en la columna Error es¬ 
tándar. Todos los programas estadísticos más ampliamente utilizados incluyen este error 
estándar estimado para el estadístico /3 0 con el cual se puede calcular la intersección /3 0 de 
la línea de regresión de la población. 
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Dependent Variable: DENSITY 





Analysis 

of Variance 


Source 

DF 

Sum of Squares 

Mean Square 

F Valué Prob > F 

Model 

1 


341.72606 

341.72606 

39.508 0.0001 

Error 

13 


112.44327 

8.64948 


C Total 

14 


454.16933 



Root 

. MSE 

2.94100 

R-square 0.7524 

Dep 

Mean 

112.90667 

Adj R-sq 0.7334 

C.V. 



2.60481 






Parameter Estimates 





Parameter 

Standard 

T for H0: 

Variable 

DF 


Estímate 

Error Parameter = 0 Prob > | T | 

INTERCEP 

1 

126.248889 2. 

25441683 

56.001 0.0001 

AIRCONT 

1 


-0.917622 0. 

14598888 

-6.286 0.0001 




Dep Var 

Predict 




Obs 

DENSITY 

Valué Residual 



1 

119.0 

121.0 

-2.0184 



2 

121.3 

120.0 

1.2909 



3 

118.2 

117.4 

0.7603 



4 

124.0 

117.1 

6.9273 



5 

112.3 

116.4 

-4.1303 



6 

114.1 

114.7 

-0.5869 



7 

112.2 

113.0 

-0.8351 



8 

115.1 

112.5 

2.6154 



9 

111.3 

112.2 

-0.9093 



10 

107.2 

111.4 

-4.1834 



11 

108.9 

109.9 

-1.0152 



12 

107.8 

109.1 

-1.2894 



13 

111.0 

108.2 

2.8283 



14 

106.2 

107.3 

-1.1459 



15 

105.0 

103.3 

1.6917 


Sum of Residuals 0 
Sum of Sguared Residuals 112.4433 
Predicted Resid SS (Press) 146.4144 


Figura 12.15 Resultados obtenidos con SAS con los datos del ejemplo 12.11. 


Procedimientos de prueba de hipótesis 

Como antes, la hipótesis nula en una prueba con respecto a ¡3 l será un enunciado de igual¬ 
dad. El valor nulo (valor de ¡3 l alegado verdadero por la hipótesis nula) será denotado por 
/3 10 (léase “beta uno cero”, no “beta diez”). El estadístico de prueba se obtiene reemplazan¬ 
do /3 en la variable estandarizada T por el valor nulo /3 10 , es decir, estandarizando el esti¬ 
mador de /3[ conforme a la suposición de que H 0 es verdadera. El estadístico de prueba tiene 
por lo tanto una distribución t con n — 2 grados de libertad cuando H 0 es verdadera, así que 
la probabilidad de error de tipo I permanece al nivel deseado a utilizando un valor crítico t 
apropiado. 

El par de hipótesis más comúnmente encontrado en torno a ¡3 l es H 0 : ¡3 l = 0 contra 
# 0. Cuando esta hipótesis nula es verdadera, ¡l y . x = ¡3 0 independiente de x, así que 
el conocimiento de x no da información sobre el valor de la variable dependiente. Una prue¬ 
ba de estas dos hipótesis a menudo se conoce como prueba de utilidad del modelo de regre¬ 
sión lineal simple. A menos que n sea demasiado pequeño, H 0 será rechazada y la utilidad 
del modelo confirmada con precisión cuando r 2 es razonablemente grande. El modelo de re¬ 
gresión lineal simple no deberá ser utilizado para más inferencias (estimaciones del valor 
medio o predicciones de valores futuros) a menos que la prueba de la utilidad del modelo 
dé por resultado el rechazo de H 0 con un a apropiadamente pequeño. 
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Ejemplo 12.12 


Hipótesis nula: H 0 : ¡3 l = ¡3 l0 

Valor estadístico de prueba: t = —-—— 

Hipótesis alternativa Región de rechazo para una prueba a nivel a 

Pi > Pío 
Pr<P l0 

Se puede calcular un valor P basado en n — 2 grados de libertad como previamente se 
hizo con pruebas t en los capítulos 8 y 9. 

La prueba de utilidad del modelo es la prueba de H 0 : /3 = 0 contra II,'. (3 ¥= 0, 
en cuyo caso el valor estadístico de prueba es la relación 11 = /3/s^. 


t>t. 


a,n—2 


t<-t. 


a,n —2 


t — 4/2.H-2 ° ? — ? o/2,n-2 


La limpieza del metal o aleación de aluminio fundida antes de vaciar una pieza está deter¬ 
minada principalmente por el contenido de hidrógeno e inclusiones del metal fundido. El 
artículo “Effect of Melt Cleanliness on the Properties of an Al-10 Wt Pct Si-10 Vol Pct 
SiC(p) Composite” (Metallurgical Trans., 1993: 1631-1645) reporta sobre un estudio en el 
cual varias propiedades de tensión se relacionaron con x = fracción volumétrica de óxidos/in¬ 
clusiones (%). Aquí se presentan datos (leídos en una gráfica) sobre y = alargamiento (%) 
de barras de prueba. Los autores afirman que la gráfica de puntos muestra una relación li¬ 
neal y dan la ecuación de la línea de mínimos cuadrados. Utilice los resultados de la figura 
12.16 generados por MINITAB y realice la prueba de utilidad de modelo a un nivel de sig¬ 
nificación a = 0.01 


X 

0.10 

0.16 

0.31 

0.37 

0.37 

0.46 

0.50 

0.50 

0.60 

0.70 

y 

0.96 

1.10 

0.80 

0.84 

0.77 

0.87 

0.60 

0.87 

0.60 

0.61 

X 

0.75 

0.80 

0.90 

1.00 

1.07 

1.08 

1.11 

1.30 

1.37 

1.54 

y 

0.70 

0.41 

0.40 

0.41 

0.45 

0.59 

0.25 

0.25 

0.08 

0.10 


The regression equation is 


elon = 1.07 — 

■ 0.649 volfrac 

S Á t= s- 

/ / 01 


Predictor 

Coef 

Stdev 

/ t-ratio / P 

Valor P 

Constant 

1.06930 

0.04966 / 

21.53 / 0.000 

para la prueba de 

volfrac 

-0.64884 

0.05840/ 

-ll.il/ 0.000 

<_utilidad del modelo 

s = 0.1049 

R-sq 

=87.3% 

R-sq(adj) = 86 

.6% 

Analysis of 

Variance 




SOURCE 

DF 

SS 

MS 

F P 

Regression 

1 

1.3583 

1.3583 

123.42 0.000 

Error 

18 

0.1981 

0.0110 


Total 

19 

1.5564 




Figura 12.16 Resultados obtenidos con MINITAB del ejemplo 12.12. 


El parámetro de interés es /3j, el cambio esperado del porcentaje de alargamiento aso¬ 
ciado con 1% de incremento de la fracción volumétrica de óxidos/inclusiones. H 0 : f3¡ = 0 
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será rechazada a favor de //: /3¡ A 0 si la relación t = /3/s^ satisface o / > f re/2jr _ 2 = 
f ooo 518 = 2.878 o t < —2.878. De acuerdo con la figura 12.16, /3, =-0.64884 y 
= 0.05840, y 

-0.64884 

í = - =-11.11 (también en la salida de resultados) 

Con claridad, —11.11 < —2.878, de modo que H 0 es resonantemente rechazada. De mane¬ 
ra alternativa, el valor P es dos veces el área capturada bajo la curva t de 18 grados de liber¬ 
tad a la izquierda de —11.11. MINITAB da un valor P = 0.000, de modo que H 0 deberá ser 
rechazada a cualquier nivel a razonable. Esta confirmación de la utilidad del modelo 
de regresión lineal simple permite calcular varias estimaciones y predicciones como se des¬ 
cribe en la sección 12.4. ■ 

Regresión y ANOVA 

La descomposición de la suma total de los cuadrados X(y, — y) 2 en una parte SCE, la cual 
mide la variación no explicada y una parte SCR, que mide la variación explicada por la re¬ 
lación lineal, hace recordar el ANOVA unidireccional. De hecho, la hipótesis nula // 0 : [3¡ = 0 
puede ser probada contra //: [3 , V 0 con una tabla ANOVA (tabla 12.2) y rechazando H 0 si 

/— Fa,l,n~2- 


Tabla 12.2 Tabla ANOVA para regresión lineal simple 


Origen de la variación 

gl 

Suma de cuadrados 

Cuadrado de la media 

/ 

Regresión 

1 

SCR 

SCR 

SCR 

SCE/(n - 2) 

Error 

n — 2 

SCE 

, SCE 

n — 2 


Total 

n — 1 

STC 





La prueba F da exactamente el mismo resultado que la prueba t de utilidad del mode¬ 
lo f 2 = /y t\j 2 n _ 2 = F a , n _ 2 . Virtualmente todos los programas de computadora que cuentan 
con opciones de regresión incluyen tal tabla ANOVA en los resultados. Por ejemplo, la fi¬ 
gura 12.15 muestra los resultados obtenidos con SAS con los datos de mortero del ejemplo 
12.11. La tabla ANOVA en la parte superior de los resultados tiene/= 39.508 con un valor 
P de 0.0001 para la prueba de utilidad de modelo. La tabla de estimaciones de parámetro da 
f = -6.286 con P = 0.0001 y (-6.286) 2 = 39.51. 


EJERCICIOS Sección 12.3 (30-43) 

i_ 


30. Reconsidere la situación descrita en el ejercicio 7, en el cual 
x = resistencia acelerada del concreto y y = resistencia des¬ 
pués de 28 días de curado. Suponga que el modelo de regre¬ 
sión lineal simple es válida con x entre 1000 y 4000 y que 
f3 1 = 1.25 y <x = 350. Considere un experimento en el cual 
n = 7 y los valores x a los cuales se realizan las observacio¬ 
nes son x 1 = 1000, x 2 = 1500, x 3 = 2000, x 4 = 2500, 
x 5 = 3000, x 6 = 3500 y x 7 = 4000. 

a. Calcule la desviación estándar de ¡3 1 . 

b. ¿Cuál es la probabilidad de que la pendiente estimada 
basada en las observaciones esté entre 1.00 y 1.50? 

c. Suponga que también es posible hacer una sola obser¬ 
vación con cada uno de los n = 11 valores x¡ = 2000, 


x 2 — 2100, . . . , x n = 3000. Si un objetivo importante 
es estimar /3¡ con tanta precisión como sea posible, 
¿se preferiría el experimento con n = lia uno con 
n = 7? 

31. Reconsidere las cantidades resumidas dadas en el ejercicio 18 
para la regresión de y = factor de deflexión en x = tempe¬ 
ratura. 

a. Calcule la desviación estándar estimada ss . 

pi 

b. Calcule un intervalo de confianza de 95% para ¡3 l , el 
cambio esperado del factor de deflexión asociado con un 
incremento de 1°F de la temperatura. 
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32. El ejercicio 16 de la sección 12.2 dio datos sobre x = volu¬ 
men de precipitación pluvial y y = volumen de escurrimien- 
to (ambos en m 3 ). Use los resultados adjuntos obtenidos con 
MINITAB para decidir si existe una relación lineal útil entre 
la precipitación pluvial y el escurrimiento y luego calcule un 
intervalo de confianza para el cambio promedio verdadero 
del volumen de escurrimiento asociado con 1 m 3 de incre¬ 
mento del volumen de precipitación pluvial. 

The regression equation is 
runof f =-1.13 + 0.827 rainfall 


Predictor Coef 
Constant -1.128 
rainfall 0.82697 


Stdev t-ratio p 

2.368 -0.48 0.642 

0.03652 22.64 0.000 


s = 5.240 R-sq=97.5% R-sq(adj) =97.3% 


33. El ejercicio 15 de la sección 12.2 incluyó resultados gene¬ 
rados por MINITAB de módulo de elasticidad con una re¬ 
gresión de resistencia a la flexión de vigas de concreto. 

a. Uselos para calcular el ancho de intervalo de confianza 
de 95% para la pendiente j 8 ¡ de la línea de regresión de 
la población e interprete el intervalo resultante. 

b. Suponga que previamente se creía que cuando el módu¬ 
lo de elasticidad se incrementa en 1 GPa, el cambio pro¬ 
medio verdadero asociado de la resistencia a la flexión 
era cuando mucho de 0.1 MPa. ¿Contradicen los datos 
esta creencia? Formule y pruebe las hipótesis pertinentes. 

34. Remítase a los resultados generados por MINITAB del ejer¬ 
cicio 20, en los cuales r = NOj deposición en húmedo y 
y = liquen N (%). 

a. Realice la prueba de utilidad de modelo al nivel 0.01, 
utilizando el método de región de rechazo. 

b. Repita el inciso a) con el método del valor P. 

c. Suponga que previamente se creía que cuando la deposi¬ 
ción en húmedo de NO 3 se incrementa en 0.1 g N/m 2 , el 
cambio asociado del liquen N esperado es por lo menos 
de 0.15%. Realice una prueba de hipótesis al nivel 0.01 
para decidir si los datos contradicen esta creencia previa. 

35. ¿Cómo afecta la aceleración lateral (fuerzas laterales expe¬ 
rimentadas en las vueltas que en gran medida están bajo el 
control del conductor) las náuseas percibidas por los pasa¬ 
jeros de un autobús? El artículo “Motion Sickness in Public 
Road Transport: The Effect of Driver, Route, and Vehicle” 
C Ergonomics , 1999: 1646-1664) reportó datos sobre x = 
dosis de mareo provocado por el movimiento (calculado de 
acuerdo con una norma británica para evaluar movimientos 
similares en el mar) y y = náusea reportada (%). Las canti¬ 
dades pertinentes son 

n = 17, E-fi = 222 . 1 , E» = 193, E-U= 3056.69, 

El» = 2759.6, E.V 2 = 2975 

Los valores de dosis en la muestra oscilaron entre 6.0 y 17.6. 

a. Suponiendo que el modelo de regresión lineal simple es 
válido para relacionar estas dos variables (esto es apoya¬ 
do por los datos sin procesar), calcule e interprete un es¬ 
timador del parámetro de pendiente que dé información 
sobre la precisión y confiabilidad de la estimación. 

b. ¿Parece haber una relación lineal útil entre estas dos va¬ 
riables? Responda la pregunta empleando el método del 
valor P. 


c. ¿Sería sensible utilizar el modelo de regresión lineal 
simple como base para predecir el % de náuseas cuando 
la dosis = 5.0? Explique su razonamiento. 

d. Cuando se utilizó MINITAB para ajustar el modelo de 
regresión lineal simple a los datos sin procesar, la obser¬ 
vación (6.0, 2.50) fue señalada como que posiblemente 
tiene un impacto sustancial en el ajuste. Elimine esta ob¬ 
servación de la muestra y recalcule la estimación del in¬ 
ciso a). Basado en esto, ¿parece ejercer la observación 
una influencia indebida? 

36. Se produce una bruma (gotas transportadas por el aire o 
aerosoles) cuando se utilizan fluidos para remover metales 
en operaciones de maquinado para enfriar y lubricar la he¬ 
rramienta y la pieza de trabajo. La generación de bruma es 
una preocupación para la OSHA, la que recientemente ha 
reducido sustancialmente la norma del lugar de trabajo. El 
artículo “Variables Affecting Mist Generation from Metal 
Removal Fluids” (Lubrication Engr., 2002: 10-17) dio los 
datos adjuntos sobre .y = velocidad de flujo de fluido de un 
aceite soluble al 5% (cm/s) y y = la cantidad de gotas de 
bruma con diámetro menor que 10 gm (mg/m 3 ): 


X 

89 

177 

189 

354 

362 

442 

965 

y 

0.40 

0.60 

0.48 

0.66 

0.61 

0.69 

0.99 


a. Los investigadores realizaron un análisis de regresión li¬ 
neal simple para relacionar las dos variables. ¿Apoya la 
gráfica de puntos esta estrategia? 

b. ¿Qué proporción de la variación observada de la bruma 
puede ser atribuida a la relación de regresión lineal sim¬ 
ple entre velocidad y bruma? 

c. A los investigadores les interesaba particularmente el 
impacto en la bruma de la velocidad creciente de 100 a 
1000 (un factor de 10 correspondiente a la diferencia en¬ 
tre los valores y más pequeños y más grandes presentes 
en la muestra). Cuando x se incrementa de esta manera, 
¿existe evidencia sustancial de que el incremento pro¬ 
medio verdadero de y es menor que 0.6? 

d. Estime el cambio promedio verdadero de la bruma aso¬ 
ciado con un incremento de 1 cm/s en la velocidad y há¬ 
galo de modo que dé información sobre precisión y 
confiabilidad. 

37. La obtención de imágenes por medio de resonancia magnéti¬ 
ca (MRI, por sus siglas en inglés) está bien establecida como 
una herramienta para medir velocidades de la sangre y flujos 
de volúmenes. El artículo “Correlation Analysis of Stenotic 
Aortic Valve Flow Pattems Using Phase Constrast MRT'. ci¬ 
tado en el ejercicio 1.67, propuso utilizar esta metodología 
para determinar el área valvular en pacientes con estenosis 
aórtica. Los datos adjuntos sobre velocidad pico (m/s) deri¬ 
vados de exámenes de 23 pacientes en dos planos diferentes 
se tomaron de una gráfica que aparece en el artículo citado. 


Nivel- 

0.60 

0.82 

0.85 

0.89 

0.95 

1.01 

1.01 

1.05 

Nivel— 

0.50 

0.68 

0.76 

0.64 

0.68 

0.86 

0.79 

1.03 

Nivel- 

1.08 

1.11 

1.18 

1.17 

1.22 

1.29 

1.28 

1.32 

Nivel— 

0.75 

0.90 

0.79 

0.86 

0.99 

0.80 

1.10 

1.15 

Nivel- 

1.37 

1.53 

1.55 

1.85 

1.93 

1.93 

2.14 


Nivel— 

1.04 

1.16 

1.28 

1.39 

1.57 

1.39 

1.32 
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a. ¿Parece haber alguna diferencia entre la velocidad pro¬ 
medio verdadera en los dos planos distintos? Realice 
una prueba de hipótesis apropiada (como lo hicieron los 
autores del artículo). 

b. Los autores del artículo también analizaron el Nivel-ve¬ 
locidad contra Nivel-velocidad. La intersección y la pen¬ 
diente estimadas resultantes son 0.14701 y 0.65393 con 
errores estándar estimados correspondientes de 0.07877 
y 0.05947, coeficiente de determinación de 0.852 y 
s = 0.110673. El artículo incluyó un comentario de 
que esta regresión mostraba evidencias de una fuerte 
relación lineal pero una pendiente de regresión muy 
por debajo de 1. ¿Está de acuerdo? 

38. Remítase a los datos sobre x = tasa de liberación y y = tasa 
de emisión de NO x dados en el ejercicio 19. 

a. ¿Especifica el modelo de regresión lineal simple una re¬ 
lación útil entre las dos tasas? Use el procedimiento de 
prueba apropiado para obtener información sobre el va¬ 
lor P y luego saque una conclusión a nivel de significa¬ 
ción de 0.01. 

b. Calcule un intervalo de confianza de 95% para cambio 
esperado de tasa de emisiones con un incremento de 10 
MBtu/h-pie 2 en la tasa de liberación. 

39. Realice la prueba de utilidad de modelo por medio del mé¬ 
todo ANOVA con los datos de contenido de humedad-tasa 
de filtración del ejemplo 12.6. Verifique que da un resultado 
equivalente al de la prueba t. 

40. Use las reglas del valor esperado para demostrar que ¡8 0 es 
un estimador insesgado de /3 0 (suponiendo que es un es¬ 
timador insesgado de jSj). 

41. a. Verifique que E(0¡) = f) ¡ con las reglas de valor espera¬ 

do del capítulo 5. 
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b. Use las reglas de varianza del capítulo 5 para verificar la 
expresión para dada en esta sección. 

42. Verifique que si cada x¡ se multiplica por una constante po¬ 
sitiva c y cada y¡ se multiplica por otra constante positiva d, 
el estadístico t para probar H 0 : fi l = 0 contra /7 a : f3¡ # 0 no 
cambia de valor (el valor de ¡3 1 cambiará, lo que demuestra 
que la magnitud de 0 l no es indicativo por sí mismo de la 
utilidad del modelo). 

43. La probabilidad de un error de tipo II con la prueba t para 
H 0 : f) 1 = /3 10 se calcula del mismo modo que para las prue¬ 
bas t del capítulo 8. Si el valor alternativo de ¡3 V denotado 
por /3(, el valor de 

I Pío" Al 

n — 1 

2 >? - (Z x f/n 

se calcula primero, luego se ingresa al conjunto apropiado 
de curvas de la tabla A. 17 del apéndice por el eje horizon¬ 
tal en el valor de d y /3 se lee en la curva de n — 2 grados 
de libertad. Un artículo que apareció en el Journal of Public 
Health Engineering reporta los resultados de un análisis de 
regresión basado en n = 15 observaciones en las cuales x = 
temperatura de aplicación de filtro (°C) y y = % de eficien¬ 
cia de eliminación de BOD. Las cantidades calculadas in¬ 
cluyen 'Zx l = 402, = 11098, i = 3.725 y ¡3 1 = 

1.7035. Considere probar a un nivel de 0.01 H 0 : f) l = 1, la 
que manifiesta que el incremento esperado en el % de eli¬ 
minación de BOD es 1 cuando la temperatura de aplicación 
del filtro se incrementa 1°C, contra la alternativa W a : jSj > 1. 
Determine P (error de tipo II) cuando j8¡ = 2, cr = 4. 


| 12.4 Inferencias sobre ¡jl y . x * y predicción de valores /futuros 

Sea x* un valor específico de la variable independiente x. Una vez que / 3 0 y / 3 , han sido calcu¬ 
ladas, /3 0 + 0 { x* puede ser considerada como una estimación puntual de ¡jt Y . x * (el valor espe¬ 
rado o el valor promedio esperado de Y cuando x = x*) o como una predicción del valor Y que 
resultará de una sola observación realizada cuando x = x*. La estimación puntual o predic¬ 
ción por sí misma no da información sobre qué tan precisamente /jl y . x * ha sido estimada o Y 
ha sido pronosticada. Esto se remedia desarrollando un intervalo de confianza para /x K . z * y 
un intervalo de predicción (IP) para un solo valor de Y. 

Antes de obtener datos muéstrales, tanto /3 0 como 0 l están sujetas a variabilidad de 
muestreo, es decir, ambos son estadísticos cuyos valores variarán de muestra en muestra. 
Supóngase, por ejemplo que j3 0 = 50 y j8 t = 2. Entonces una primera muestra de pares 
( x , y) podría dar ¡3 () = 52.35, /3 1 = 1.895, una segunda muestra podría dar / 3 0 = 46.52, 
/3! = 2.056 y así sucesivamente. Se desprende que Y = ¡3 0 + 0 l x* misma cambia de valor 
de muestra en muestra, así que es un estadístico. Si la intersección y la pendiente de la lí¬ 
nea de la población son los valores antes mencionados 50 y 2, de manera respectiva, y 
x* = 10, entonces este estadístico está tratando de estimar el valor 50 + 2(10) = 70. La es¬ 
timación con una primera muestra podría ser 52.35 + 1.895(10) = 71.30, con una segunda 
muestra podría ser 46.52 + 2.056(10) = 67.08 y así sucesivamente. Del mismo modo que 
un intervalo de confianza para /3 [ estaba basado en propiedades de la distribución de mues¬ 
treo de j8(, un intervalo de confianza para un valor y medio en regresión está basado en pro¬ 
piedades de la distribución de muestreo del estadístico / 3 0 + 
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La sustitución de la expresión para ¡3 0 y /3 x en jS 0 + 0 x x* seguida por algunas mani¬ 
pulaciones algebraicas conduce a la representación de j8 0 + /3¡x* como una función lineal 
de las Y¡\ 


P 0 + /3,x* = 2 

i= 1 


1 (x* — x)(x¡ — x) 

n + E(x, - x) 2 


n = I d,Y, 

i=l 


Los coeficientes d-,, , d n en esta función lineal implica las x¡ y x*, las cuales son fi¬ 

jas. La aplicación de las reglas de la sección 5.5 a esta función lineal da las siguientes pro¬ 
piedades. 



Sea Y = 0 O + 0¡x*, donde x* es algún valor fijo de x. Entonces 
1. El valor medio de Y es 


2 . 


E(Y) = E(0 O + 0 x x*) = = 13 o + P x x* 

Así pues |S 0 + f3 x x* es un estimador insesgado de ¡3 0 + j3 x x* (es decir, de /x K . x „). 
La varianza de Y es 


V(Y) 


■ 1 (x* — x) 2 

~2 

" 1 ^ (x* — x) 2 " 

n ' Ex? - (Xx,) 2 /« 

— (T 

_n S xx 


y la desviación estándar o-y es la raíz cuadrada de esta expresión. La desviación 
estándar estimada de /3 0 + P x x*, denotada por sy o IIXixt , se obtiene al reemplazar cr 
por su estimación s: 


s y %+p,x* s 

3. Y tiene una distribución normal. 



(x* — x) 2 



La varianza de fí (l + /3[X* es más pequeña cuando x* = x y se incrementa a medida que x* 
de aleja de x en una u otra dirección. Por consiguiente, la estimación de ¡± Y . X . es más preci¬ 
sa cuando x* está cerca del centro de las x¡ que cuando está lejos de los valores x a los cua¬ 
les se realizaron las observaciones. Esto implicará tanto que el intervalo de confianza como 
el intervalo de predicción sean más angostos con una x* cerca de x que con una x* lejos 
de x. La mayoría de los programas de computadora dan tanto ¡3 f) + /3[X* como .vy .^ ir . con 
cualquier x* especificada. 

Inferencias sobre ¡ jl y . x * 

Así como los procedimientos inferenciales para /3, se basaron en la variable t obtenida es¬ 
tandarizando ¡3 V una variable t obtenida estandarizando ¡3 0 + f3¡x* conduce a un intervalo 
de confianza y procedimientos de prueba en este caso. 


TEOREMA 


La variable 


T = 


Po + Pi x * ~ (J3 0 + Pi x *) 


(Po + Pi-r*) 




tiene una distribución t con n — 2 grados de libertad. 


(12.5) 
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Como para fü l en la sección previa, un enunciado de probabilidad que implica esta va¬ 
riable estandarizada puede ser manipulado para que dé un intervalo de confianza para /i Y . x *. 


Un intervalo de confianza de 100(1 — a)% para ¡x Y . x ,., el valor esperado de Y cuan¬ 
do x = x* es 

/3 0 + PyX* ± f„/2,„-2 ‘ s p„+p,x* = y — *an,n-2 ' S Y (12.6) 


Este intervalo de confianza está centrado en la estimación puntual de ¡jl y . x * y se extiende a 
cada lado en una cantidad que depende del nivel de confianza y del grado de variabilidad 
del estimador en el cual está basada la estimación puntual. 

Ejemplo 12.13 La corrosión de varillas de refuerzo de acero es el problema de durabilidad más importante 
de estructuras de concreto reforzadas. La carbonatación del concreto ocurre a consecuencia de 
una reacción química que reduce el pH lo suficiente para iniciar la corrosión de las varillas 
de refuerzo. A continuación se dan datos representativos sobre x = profundidad de carbo¬ 
natación (mm) y y = resistencia (MPa) para una muestra de especímenes testigo tomados 
de un edificio particular (tomados de una gráfica que aparece en el artículo “The Carbona- 
tion of Concrete Structures in the Tropical Environment of Singapore”, Magazine of Con¬ 
crete Res., 1996: 293-300). 



X 

8.0 

15.0 

16.5 

20.0 

20.0 

27.5 

30.0 

30.0 

35.0 

y 

22.8 

27.2 

23.7 

17.1 

21.5 

18.6 

16.1 

23.4 

13.4 

X 

38.0 

40.0 

45.0 

50.0 

50.0 

55.0 

55.0 

59.0 

65.0 

y 

19.5 

12.4 

13.2 

11.4 

10.3 

14.1 

9.7 

12.0 

6.8 



Gráfica de regresión 
Y = 27.1829-0.297561 X 
R-Sq = 76.6 % 



Regresión 
95% Cl 
95% Pl 


Figura 12.17 Gráfica de puntos generada por MINITAB con intervalos de confianza e intervalos de 
predicción con los datos del ejemplo 12.13. 
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Una gráfica de puntos de los datos (véase la figura 12.17) apoya fuertemente el uso del mo¬ 
delo de regresión lineal simple. Las siguientes son cantidades pertinentes: 


= 659.0 
S>’, = 293.2 
/3, = -0.297561 
r 2 = 0.766 


£*; = 28 967.50 
2jc¡y¡ = 9293.95 
/3 0 = 27.182 9 36 
í = 2.8640 


i = 36.6111 
Zv? = 5335.76 
SCE = 131.2402 


S xx = 4840.7778 


Calcúlese ahora un intervalo de confianza, utilizando un nivel de confianza de 95%, para la re¬ 
sistencia media de todos los especímenes testigo que tienen una profundidad de carbonatación 
de 45 mm, es decir, un intervalo de confianza para ¡3 0 + /3, (45). El intervalo está centrado en 

y = j8 0 + )3 1 (45) = 27.18 - 0.2976(45) = 13.79 

La desviación estándar estimada del estadístico Y es 


S Y 


2.8640 



(45 - 36.61117 

4840.7778 


0.7582 


El valor crítico t de 16 grados de libertad para un intervalo de confianza de 95% es 2.120, 
con el cual se determina que el intervalo deseado es 

13.79 ± (2.120X0.7582) = 13.79 ± 1.61 = (12.18, 15.40) 

La angostura de este intervalo sugiere que se tiene información razonablemente precisa so¬ 
bre el valor medio que se está estimando. Recuerde que si recalcula este intervalo para mues¬ 
tra tras muestra, a la larga aproximadamente 95% de los intervalos calculados incluirían 
/3 0 + /3j(45). Sólo se puede esperar que este valor medio quede en el intervalo que se calculó. 

La figura 12.18 muestra resultados MINITAB obtenidos por una solicitud de ajustar 
el modelo de regresión lineal simple y calcular intervalos para el valor medio de resistencia 
a profundidades de 45 mm y 35 mm. Los intervalos aparecen en la parte inferior de los re¬ 
sultados; obsérvese que el segundo intervalo es más angosto que el primero, porque 35 está 
mucho más cerca de x que 45. La figura 12.17 muestra 1) curvas correspondientes a los lí¬ 
mites de confianza con cada valor x diferente y 2) límites de predicción que se discutirán en 
breve. Obsérvese cómo las curvas se alejan cada vez más a medida que x se aleja de x. 


The regression equation 
Predictor Coef 


is strength = 27.2 — 0.298 depth 


Stdev 


t-ratio 


Constant 
depth 
s = 2.864 


27.183 
-0.29756 
R-sg = 76.6% 


1.651 16.46 

0.04116 -7.23 

R-sq(adj) =75.1% 


Analysis of Variance 
SOURCE DF 


Regression 

Error 

Total 

Fit 
13.793 

Fit 
16.768 


1 

16 
17 

Stdev.Fit 
0.758 

Stdev.Fit 
0.678 


SS 

428.62 
131.24 
559.86 


MS 

428.62 
8.20 


95.0% C.X. 
(12.185, 15.401) 

95.0% C.I. 
(15.330, 18.207) 


0.000 

0.000 


F 

52.25 


P 

0.000 


95.0% P.I. 
(7.510, 20.075) 

95.0% P.I. 
(10.527, 23.009) 


Figura 12.18 Resultados de regresión obtenidos con MINITAB con los datos del ejemplo 12.13. 


En algunas situaciones, se desea un intervalo de confianza no sólo para un valor x si¬ 
no para dos o más valores x. Supóngase que un investigador desea un intervalo de 
confianza tanto para ¡jl y . v como para ¡jl y . w , donde vy w son dos valores diferentes de la va¬ 
riable independiente. Es tentador calcular el intervalo (12.6) primero con x = v y luego con 
x = w. Supóngase que se utiliza a = 0.05 en cada cálculo para obtener dos intervalos de 
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95%. Luego, si las variables implicadas al calcular los dos intervalos fueran independientes 
una de otra, el intervalo de confianza conjunto sería (0.95) • (0.95) ~ 0.90. 

Sin embargo, los intervalos no son independientes porque se utilizan las mismas 0 O , 
/3[ y S en cado uno. Por consiguiente, no se puede aseverar que el intervalo de confianza con¬ 
junto para los dos intervalos sea exactamente de 90%. Se puede demostrar, no obstante, que 
si el intervalo de confianza de 100(1 — a)% (12.6) se calcula tanto con x = v como con 
x = w para obtener intervalos de confianza conjuntos para p r . v y p Y . w , entonces, el nivel de 
confianza conjunto en el par de intervalos resultante es por lo menos de 100(1 — 2 a)%. En 
particular, si se utiliza a = 0.05 se obtiene un intervalo de confianza conjunto de por lo me¬ 
nos 90%, en tanto que si se utiliza a = 0.01 se obtiene un nivel de confianza de por lo 
menos 98%. Para muestra, en el ejemplo 12.13, un intervalo de confianza de 95% para p Y . 45 
fue (12.185, 15.401) y un intervalo de confianza de 95% para p , y . 35 fue (15.330, 18.207). El 
nivel de confianza simultáneo o conjunto para las dos proposiciones 12.185 < p Y . 45 < 
15.401 y 15.330 < p Y . 35 < 18.207 es por lo menos de 90%. 

La validez de estos intervalos de confianza conjuntos o simultáneos se fundamenta en 
un resultado de probabilidad llamado desigualdad de Bonferroni, así que los intervalos de 
confianza conjuntos se conocen como intervalos de Bonferroni. El método es fácil de ge¬ 
neralizar para que dé intervalos conjuntos para k diferentes p Yx . Utilizando el intervalo 
(12.6) por separado primero con x = x* luego con x = x*, ■ ■ ■ y finalmente con x = x*se 
obtiene un conjunto de k intervalos de confianza con los cuales el nivel de confianza simul¬ 
táneo o conjunto está garantizado que sea de por lo menos 100(1 — ka)%. 

Las pruebas de hipótesis con respecto a /3 0 + /3 ¡x* están basadas en el estadístico de 
prueba T obtenido reemplazando /3 0 + /3,x* en el numerador de (12.5) por el valor nulo 
de p 0 . Por ejemplo, H 0 : ¡3 0 + /3,(45) = 15 en el ejemplo 12.13 expresa que cuando la pro¬ 
fundidad de carbonatación es de 45, la resistencia esperada (es decir, promedio verdadera) 
es de 15. El valor estadístico de prueba es entonces t = [/3 0 + /3[(45) — 15]/v / 3 o+/ 3 l(45 - ) y la 
prueba es de cola superior, inferior o de dos colas de acuerdo con la desigualdad en // a . 

Intervalo de predicción para un valor futuro de Y 

Análogo al intervalo de confianza (12.6) para p Y . x », con frecuencia se desea obtener un in¬ 
tervalo de valores factibles para el valor de Y asociado con alguna observación futura cuan¬ 
do la variable independiente tiene el valor x*. Para muestra, en el ejemplo en el cual el 
tamaño del vocabulario y está relacionado con la edad x de un niño, con x = 6 años (12.6) 
daría un intervalo de confianza para el tamaño de vocabulario promedio verdadero de todos 
los niños de 6 años. Alternativamente, se podría desear un intervalo de valores posibles 
para el tamaño del vocabulario de un niño particular de 6 años. 

Un intervalo de confianza se refiere a un parámetro, o característica de una población, 
cuyo valor es fijo pero desconocido. En contraste, un valor futuro de Y no es un parámetro 
sino una variable aleatoria; por eso se hace referencia a un intervalo de valores factibles 
para un valor Y futuro como intervalo de predicción en lugar de intervalo de confianza. El 
error de estimación es /3 0 + |3 ¡x* — (/3 0 + jSpt*), una diferencia entre una cantidad fija 
(pero desconocida) y una variable aleatoria. El error de predicción es Y — (/3 0 + /3,x*), 
una diferencia entre dos variables aleatorias. Existe por lo tanto más incertidumbre en la 
predicción que en la estimación, así que un intervalo de predicción será más ancho que un 
intervalo de confianza. Como el valor futuro Y es independiente de las Y¡ observadas, 

V[Y ~ (fio + &**)] = 


varianza del error de predicción 
V(Y) + V(0 O + &X*) 


CT” + CT- 


1 (x* — x) 2 

n S . 


1 (x* — x) 2 

1 + - + -<- 

n 
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Además, como E(Y) = /3 0 + ¡3 lX * y E(¡3 0 + jSpc*) = ¡3 0 + jSpt*, el valor esperado del error 
de predicción es E(Y — (j8 0 + I3¡x*)) = 0. Se puede demostrar entonces que la variable es¬ 
tandarizada 


T = 


y-(/3 0 + j6,r*) 

L | 1 j (x*~ x) 2 

/ n S rr 


tiene una distribución t con n — 2 grados de libertad. Sustituyendo esta T en la proposición 
de probabilidad P(—t a/2 „_ 2 < T < t a/2 n _ 2 ) = 1 — a y manipulándola para aislar Y entre las 
dos desigualdades se obtiene el siguiente intervalo. 


Un intervalo de predicción de 100(1 - a)% para una observación Y futura que 
se va a realizar cuando x = jc* es 

„ / 1 (x* — x) 2 

/ 3 0 + f3 lX * ± t a/2 2 • s í + - + TI ( 12 . 7 ) 

V n Oxr 

— Po Pl X * — U/2,n-2 ‘ 3- Sf 3 0+ p íX * 

= y± W -2 • VV + 4 


La interpretación del nivel de predicción de 100(1 — a)% es idéntico al de los niveles de 
confianza previos, si se utiliza (12.7) repetidamente, a la larga los intervalos resultantes en 
realidad contendrán los valores y observados el 100(1 — a)% del tiempo. Obsérvese que el 
1 debajo de la raíz cuadrada inicial hace que el intervalo de predicción (12.7) sea más an¬ 
cho que el intervalo de confianza (12.6), aun cuando ambos intervalos estén centrados en 
j8 0 + ¡3 x x*. Además, a medida que n —* el ancho del intervalo de confianza tiende a cero, 
en tanto que el ancho del intervalo de predicción no (porque incluso con el perfecto cono¬ 
cimiento de ¡3 0 y ¡3 V seguirá habiendo incertidumbre en la predicción). 

Ejemplo 12.14 Regrese a los datos de profundidad de carbonatación del ejemplo 12.13 y calcule un inter¬ 
valo de predicción de 95% para un valor de resistencia que resultaría de seleccionar un solo 
espécimen testigo cuya profundidad de carbonatación es de 45 mm. Cantidades pertinentes 
del ejemplo son 

y = 13.79 = 0.7582 s = 2.8640 

Con un nivel de predicción de 95% basado en n — 2 = 16 grados de libertad, el valor críti¬ 
co es 2.120, exactamente el que se utilizó antes para un nivel de confianza de 95%. El in¬ 
tervalo de predicción es entonces 

13.79 ± (2.120)V(2.8640) 2 + (0.7582) 2 = 13.79 ± (2.120)(2.963) 

= 13.79 ± 6.28 = (7.51, 20.07) 

Valores posibles para una sola observación de resistencia cuando la profundidad es de 45 
mm son (al nivel de predicción de 95%) entre 7.51 MPa y 20.07 MPa. El intervalo de con¬ 
fianza de 95% para una resistencia media cuando la profundidad es de 45 fue (12.18, 15.40). 
El intervalo de predicción es mucho más ancho debido a los (2.8640) 2 extra bajo la raíz cua¬ 
drada. La figura 12.18, los resultados MINITAB del ejemplo 12.13, muestran este intervalo 
así como también el intervalo de confianza. ■ 

La técnica Bonferroni puede ser empleada como en el caso del intervalo de confian¬ 
za. Si se calcula un intervalo de predicción de 100(1 — a)% para cada uno de k valores di¬ 
ferentes de x, el nivel de predicción simultánea o conjunta para los k intervalos es por lo 
menos de 100(1 — ka)%. 
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EJERCICIOS Sección 12.4 (44-56) 


44 . El ajuste del modelo de regresión lineal simple a las n = 27 
observaciones de x = módulo de elasticidad y y = resisten¬ 
cia a la flexión dados en el ejercicio 15 de la sección 12.2 
dio por resultado y = 7.592, Sy = 0.179 cuando re = 40 y 
y = 9.741, Sy = 0.253 con x = 60. 

a. Explique por qué Sy es más grande cuando x = 60 que 
cuando x = 40. 

b. Calcule un intervalo de confianza con un nivel de con¬ 
fianza de 95% para la resistencia promedio verdadera de 
todas las vigas cuyo módulo de elasticidad es de 40. 

c. Calcule un intervalo de predicción con un nivel de 95% 
para la resistencia de una sola viga cuyo módulo de elas¬ 
ticidad es 40. 

d. Si se calcula un intervalo de confianza de 95% para la 
resistencia promedio verdadera cuando el módulo de 
elasticidad es de 60, ¿cuál será el nivel de confianza si¬ 
multáneo tanto para este intervalo como para el interva¬ 
lo calculado en el inciso b)? 

45 . Reconsidere los datos de contenido de humedad-tasa de fil¬ 
tración introducidos en el ejemplo 12.6 (véase también el 
ejemplo 12.7). 

a. Calcule un intervalo de confianza de 90% para /3 0 + 
125)3!, el contenido de humedad promedio verdadera 
cuando la tasa de filtración es 125. 

b. Pronostique el valor del contenido de humedad con un 
solo experimento en el cual la tasa de filtración es de 
125 utilizando un nivel de predicción de 90%. ¿Cómo se 
compara este intervalo al intervalo del inciso a)? ¿Por 
qué es éste el caso? 

c. ¿Cómo se compararían los intervalos de los incisos a) y 
b) con un intervalo de confianza y un intervalo de pre¬ 
dicción cuando la tasa de filtración es de 115? Respon¬ 
da sin calcular en realidad estos nuevos intervalos. 

d. Interprete las hipótesis H 0 : fi 0 + 125/3 1 = 80 y H 0 \ f3 0 + 
125 ¡3 l < 80, y luego realice una prueba a un nivel de 
significación de 0.01. 

46 . El artículo "The Incorporation of Uranium and Silver by Hy- 
drothermally Synthesized Galena” ( Econ. Geology, 1964: 
1003-1024) reporta sobre la determinación de contenido de 
plata de cristales de galena desarrollados en un sistema hidro- 
térmico cerrado dentro de un rango de temperatura. Con x = 
temperatura de cristalización en °C y y = Ag,S en mol%, los 
datos son los siguientes: 


X 

398 

292 

352 

575 

568 

450 

550 

408 

484 

350 

503 

600 

600 

V 

0.15 

0.05 

0.23 

0.43 

0.23 

0.40 

0.44 

0.44 

0.45 

0.09 

0.59 

0.63 

0.60 


con los cuales Eq = 6130, £xj = 3022050, E>’, = 4.73, 
£y?= 2.1785, Zjqy, = 2418.74, & = 0.00143,)3 0 = -0.311 
y s = 0.131. 

a. Estime el contenido de plata promedio verdadero cuan¬ 
do la temperatura es de 500°C utilizando un intervalo de 
confianza de 95 por ciento. 

b. ¿Cómo se compararía el ancho de un intervalo de con¬ 
fianza de 95% para el contenido de plata promedio ver¬ 
dadero cuando la temperatura es de 400°C con el ancho 
del intervalo del inciso a)? Responda sin calcular este 
nuevo intervalo. 


c. Calcule un intervalo de confianza de 95% para el cam¬ 
bio promedio verdadero del contenido de plata con un 
incremento de 1°C de la temperatura. 

d. Suponga que previamente se creía que cuando la tempe¬ 
ratura de cristalización era de 400°C, el contenido de 
plata promedio verdadero sería de 0.25. Realice una 
prueba a un nivel de significación de 0.05 para decidir si 
los datos muéstrales contradicen esta creencia previa. 

47. El modelo de regresión lineal simple se ajusta muy bien a los 
datos de precipitación pluvial y volumen de escurrimiento da¬ 
dos en el ejercicio 16 de la sección 12.2. La ecuación de la 
línea de cuadrados mínimos es y = —1.128 + 0.82697x, 
r 2 = 0.975 y 5 = 5.24. 

a. Use el hecho de que Sy = 1.44 cuando el volumen de la 
precipitación pluvial es de 40 m 3 para predecir el escu¬ 
rrimiento en una forma que transmita información sobre 
confiabilidad y precisión. ¿Sugiere el intervalo resultan¬ 
te que se dispone de información precisa sobre el valor 
de escurrimiento con esta futura observación? Explique 
su razonamiento. 

b. Calcule un intervalo de precisión para escurrimiento 
cuando la precipitación pluvial es de 50 utilizando el 
mismo nivel de predicción del inciso a). ¿Qué se puede 
decir sobre el nivel de predicción simultáneo para los 
dos intervalos que calculó? 

48 . El resumidero en un colector pluvial es la superficie de con¬ 
tacto entre el escurrimiento superficial y el conductor de 
desagüe. El inserto del resumidero es un dispositivo que me¬ 
jora las propiedades supresoras de contaminantes de éste. El 
artículo “An Evaluation of the Urban Stormwater Pollutant 
Removal Efficiency of Catch Basin Inserís” ( Water Envir. 
Res., 2005- 500-510) reportó pruebas de varios insertos en 
condiciones controladas en las que el flujo de entrada es 
muy parecido al que se puede esperar en el campo. Conside¬ 
re los siguientes datos, tomados de una gráfica que aparece 
en el artículo, para un tipo particular de inserto sobre x can¬ 
tidad filtrada (miles de litros) y y = % total de sólidos sus¬ 
pendidos eliminados. 


X 

23 

45 

68 

91 

114 

136 

159 

182 

205 228 

y 

53.3 

26.9 

54.8 

33.8 

29.9 

8.2 

17.2 

12.2 

3.2 11.1 


En resumen las cantidades son 

E*¡ = 1251,2*?= 199365,Ey¿ = 250.6, Ey? = 9249.36, 

'Lxyi = 21 904.4 

a. ¿Avala la gráfica de puntos la selección del modelo de 
regresión simple? Explique. 

b. Obtenga la ecuación de la línea de mínimos cuadrados. 

c. ¿Qué proporción de la variación observada en el % de 
eliminación puede ser atribuida a la relación de modelo? 

d. ¿Especifica el modelo de regresión lineal simple una re¬ 
lación útil? Realice una prueba de hipótesis apropiadas 
con un nivel de significación de 0.05. 

e. ¿Existe una fuerte evidencia para concluir que por lo 
menos existe 2% de reducción de la eliminación de só¬ 
lidos suspendidos promedio verdadera con un incremen¬ 
to de 10000 litros de la cantidad filtrada? Pruebe las 
hipótesis apropiadas con a = 0.05. 
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484 CAPITULO 12 Regresión lineal simple y correlación 

f. Calcule e interprete un intervalo de confianza de 95% 
para el % eliminado promedio verdadero cuando la can¬ 
tidad filtrada es de 100 000 litros. ¿Cómo se compara este 
intervalo con respecto al ancho cuando la cantidad filtra¬ 
da es de 200 000 litros? 

g. Calcule e interprete un intervalo de predicción de 95% 
para % eliminado cuando la cantidad filtrada es de 100000 
litros. ¿Cómo se compara este intervalo en cuanto al an¬ 
cho con el intervalo de confianza calculado en f) y con 
intervalo de predicción cuando la cantidad filtrada es de 
200 000 litros? 

49 . Le informan que un intervalo de confianza de 95% para el 
contenido de plomo esperado cuando el flujo de tráfico es de 
15, basado en una muestra de n = 10 observaciones es 
(462.1, 597.7). Calcule un intervalo de confianza de 99% para 
el contenido de plomo esperado cuando el tráfico es de 15. 

50 . Se han utilizado aleaciones de silicio-germanio en ciertos 
tipos de celdas solares. El artículo “Silicon-Germanium 
Films Deposited by Low-Frequency Plasma-Enhanced 
Chemical Vapor Deposition” (7. of Materials Res., 2006: 
88-104) reportó sobre un estudio de varias propiedades es¬ 
tructurales y eléctricas. Considere los datos adjuntos sobre 
x — concentración de Ge en fase sólida (desde 0 hasta 1) y 
y = posición de nivel Fermi (eV). 


X 

0 0.420.230.330.620.600.450.870.900.79 1 1 1 

y 

0.62 0.53 0.61 0.59 0.50 0.55 0.59 0.310.43 0.46 0.23 0.22 0.19 


Una gráfica de puntos muestra una relación lineal sustan¬ 
cial. He aquí una salida MINITAB de un ajuste de cuadra¬ 
dos mínimos. [ Nota : Existen varias inconsistencias entre los 
datos dados en el artículo, la gráfica que allí aparece y la in¬ 
formación resumida sobre un análisis de regresión.] 

The regression equation is 

Fermi pos = 0.7217 - 0.4327 Ge cono 

S = 0.0737573 R-Sq = 80.2% R-Sq(adj) = 78.4% 


Analysis of 

Variance 

Source 

DF 

SS 

Regression 

1 

0.241728 

Error 

11 

0.059842 

Total 

12 

0.301569 


MS F P 

0.241728 44.43 0.000 

0.005440 


a. Obtenga una estimación de intervalo del cambio esperado 
en la posición del nivel Fermi asociado con un incremento 
de 0.1 en la concentración de Ge e interprete su estimación. 

b. Obtenga una estimación de intervalo para la posición 
media del nivel Fermi cuando la concentración es de 0.50 
e interprete su estimación. 

c. Obtenga un intervalo de valores factibles para la posi¬ 
ción que resulta de una sola observación que ha de rea¬ 
lizarse cuando la concentración es de 0.50, interprete su 
intervalo y compare con el intervalo de b). 

d. Obtenga intervalos de confianza simultáneos para la po¬ 
sición esperada cuando la concentración es de 0.3, 0.5 y 
0.7; el intervalo de confianza conjunto deberá ser por lo 
menos de 97%. 


51 . Remítase al ejemplo 12.12 en el cual x = fracción volumé¬ 
trica de óxidos/inclusiones y y = % de alargamiento. 


a. MINITAB dio ^ o+( 3 i(040) 0.0311 y s^ o+ p i(120) 0.0352. 

¿Por qué la primera desviación estándar estimada es más 
pequeña que la segunda? 

b. Use los resultados obtenidos con MINITAB de ejemplo 
para calcular un intervalo de confianza de 95% para el 
% de alargamiento esperado cuando la fracción volumé¬ 
trica es = 0.40. 

c. Use los resultados obtenidos con MINITAB para calcu¬ 
lar un intervalo de predicción de 95% para un solo valor 
de % de alargamiento que ha de ser observado cuando la 
fracción volumétrica es = 1.20. 

52. El grabado con plasma es esencial en la transferencia de pa¬ 
trones de líneas finas en procesos de semiconductores de 
corriente. El artículo “Ion Beam-Assisted Etching of Alu- 
minum with Chlorine “ (J. Electrochem. Soc., 1985: 2010- 
2012) da los datos adjuntos (tomados de una gráfica) 
sobre flujo de cloro ( x , en SCCM) a través de una tobera 
utilizado en el mecanismo de grabado y en la velocidad de 
grabado (y, en 100 A/rnin). 


X 

1.5 

1.5 

2.0 

2.5 

2.5 

3.0 

3.5 

3.5 

4.0 

y 

23.0 

24.5 

25.0 

30.0 

33.5 

40.0 

40.5 

47.0 

49.0 


Las cantidades resumidas son Zx¿ = 24.0, Zy¡ = 312.5, 
Zxj = 70.50, Zx¡y¡ = 902.25, Zy] = 1 1 626.75, j8 0 = 
6.448718, /§! = 10.602564. 

a. ¿Especifica el modelo de regresión lineal simple una rela¬ 
ción útil entre el flujo de cloro y la velocidad de grabado? 

b. Estime el cambio promedio verdadero en la velocidad 
de grabado asociado con un incremento de 1 SCCM en 
la velocidad de flujo utilizando un intervalo de confian¬ 
za de 95% e interprete el intervalo. 

c. Calcule un intervalo de confianza de 95% para /r y . 30 , la 
velocidad de grabado promedio verdadera cuando el flu¬ 
jo = 3.0 ¿Ha sido estimado con precisión este promedio? 

d. Calcule un intervalo de precisión de 95% para una sola 
observación futura de velocidad de grabado que se rea¬ 
lizará cuando el flujo = 3.0. ¿Es probable que sea pre¬ 
cisa la observación? 

e. ¿Serían los intervalos de confianza y predicción de 95% 
cuando el flujo = 2.5 más ancho o más angosto que los 
intervalos correspondientes de los incisos c) y d)? Res¬ 
ponda sin que en realidad calcule los intervalos. 

f. ¿Recomendaría calcular un intervalo de predicción de 
95% para un flujo de 6.0? Explique. 

53. Considere los siguientes cuatro intervalos basados en los 
datos del ejemplo 12.4 (sección 12.2): 

a. Un intervalo de confianza de 95% para la porosidad me¬ 
dia cuando el peso unitario es de 110. 

b. Un intervalo de confianza de 95% para la porosidad 
cuando el peso unitario es de 110. 

c. Un intervalo de confianza de 95% para la porosidad me¬ 
dia cuando el peso unitario es de 115. 

d. Un intervalo de confianza de 95% para la porosidad 
cuando el peso unitario es de 115. 

Sin calcular alguno de estos intervalos, ¿qué se puede decir 
sobre sus anchos uno con respecto al otro? 

54. La declinación de los abastos de agua en ciertas áreas de 
Estados Unidos ha creado la necesidad de incrementar el 
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conocimiento de las relaciones entre factores económicos 
tales como rendimiento de cosechas y factores hidrológicos y 
de suelos. El artículo “Variability of Soil Water Properties 
and Crop Yield in a Sloped Watershed” (Water Resources 
Bull., 1988: 281-288) da datos sobre cosechas de sorgo (y, 
en g/m-surco) y distancia pendiente arriba (*, en m) en una 
cuenca inclinada. En la tabla adjunta se dan observaciones 
seleccionadas. 


X 

0 

10 

20 

30 

45 

50 

70 

y 

500 

590 

410 

470 

450 

480 

510 

X 

80 

100 

120 

140 

160 

170 

190 

y 

450 

360 

400 

300 

410 

280 

350 


a. Construya una gráfica de puntos. ¿Parece ser factible este 
modelo de regresión lineal simple? 

b. Realice una prueba de la utilidad del modelo. 

c. Estime el rendimiento promedio verdadero cuando la 
distancia pendiente arriba es de 75 dando un intervalo de 
valores factibles. 

55. Verifique que en realidad V( j3 0 + /3¡.t) está dada por la ex¬ 
presión que aparece en el texto. [Sugerencia: V(^d¡Y¡) = 

v(y¡).] 

56. El artículo (“Bone Density and Insertion Torque as Predic- 
tors of Anterior Cruciate Ligament Graft Fixation Strength” 
TheAmer. J. of Sports Med., 2004: 1421-1429) dio los datos 
adjuntos sobre par de torsión de inserción máximo (N ■ m) y 
carga de cedencia (N), donde ésta mide la resistencia del in¬ 
jerto, correspondientes a 15 especímenes diferentes. 
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Torsión 

1.8 

2.2 

1.9 

1.3 

2.1 

2.2 

1.6 

2.1 

Carga 

491 

477 

598 

361 

605 

671 

466 

431 

Torsión 

1.2 

1.8 

2.6 

2.5 

2.5 

1.7 

1.6 


Carga 

384 

422 

554 

577 

642 

348 

446 



a. ¿Es posible que la carga de cedencia esté normalmente 
distribuida? 

b. Estime la carga de cedencia promedio verdadera calcu¬ 
lando un intervalo de confianza de 95% e interprételo. 

c. Los siguientes son resultados obtenidos con MINITAB 
para la regresión de la carga de cedencia generada por el 
momento de torsión. ¿Especifica el modelo de regresión 
lineal simple una relación útil entre las variables? 


Predictor 

Coef 

SE Coef 

T 

p 

Constant 

152.44 

91 

. 17 

1.67 

0.118 

Torque 

178.23 

45. 

.97 

3.88 

0.002 

S = 73.2141 

R-Sq = 

= 53.6% 

R-Sq(adj) = 

50.0% 

Source 

DF 

SS 

MS 

F 

P 

Regression 

1 

80554 

80554 

15.03 

0.002 

Residual Error 13 

69684 

5360 



Total 

14 

150238 





d. Los autores del artículo citado expresan: “Por consi¬ 
guiente, no se puede sino concluir que los métodos basa¬ 
dos en análisis de regresión simple no son clínicamente 
suficientes para predecir la resistencia de fijación indivi¬ 
dual”. ¿Está de acuerdo? [ Sugerencia: Considere prede¬ 
cir la carga de cedencia cuando el momento de torsión 
es de 2.0.] 


| 12.5 Correlación 

Existen muchas situaciones en las que el objetivo al estudiar el comportamiento conjunto de 
dos variables es ver si están relacionadas, en lugar de utilizar una para predecir el valor de la 
otra. En esta sección, primero se desarrolla el coeficiente de correlación muestral r como 
una medida de qué tan fuerte es la relación entre dos variables x y y en un muestra y luego 
se relaciona r con el coeficiente de correlación p definido en el capítulo 5. 

Coeficiente de correlación muestral r 

Dados n pares de observaciones (x¡, y,), (x 2 , y 2 ), ■ ■ • , (x n , y n ), es natural hablar de que x 
y y tienen una relación positiva si las x grandes se aparean con y grandes y las x pequeñas 
con y pequeñas. Asimismo, si las x grandes se aparean con y pequeñas y las x pequeñas 
con y grandes, entonces se implica una relación negativa entre las variables. Considérese 
la cantidad 

s xy = f J ( x i - *)Oí - y) = ¿ x¿y¡ - ^ É y¡j/ n 

Entonces si la relación es fuertemente positiva, una x¡ por encima de la media x tenderá a apa¬ 
rearse con una y¡ por encima de la media y, de modo que (x¡ — x)(y¡ — y) > 0 y este producto 
también será positivo siempre que tanto x¡ como y¡ estén por debajo de sus medias respectivas. 
De este modo una relación positiva implica que S xy será positiva. Un argumento análogo de¬ 
muestra que cuando la relación es negativa, S xy será negativa, puesto que la mayoría de los pro¬ 
ductos ( x¡ — i)(y, — y) seguirán siendo negativos. Esto se ilustra en la figura 12.19. 

























CAPITULO 12 Regresión lineal simple y correlación 


DEFINICIÓN 


Ejemplo 12.15 



Figura 12.19 a) Gráfica de puntos con Supositiva; b) gráfica de puntos con S xy negativa [+ significa 
(x¡ - x)(y¡ - y) > 0; y - significa [x¡ - x)[y¡ - y) < 0], 


Aunque S xy parece ser una medida factible de la fuerza de una relación, aún no se sabe 
qué tan positiva o negativa pueda ser. Por desgracia, S xy tiene un serio defecto: Si se cam¬ 
bian las unidades de medición de x o y, se puede hacer que S sea arbitrariamente grande 
en magnitud o arbitrariamente próxima a cero. Por ejemplo, si S = 25 cuando x se 
mide en metros, en ese caso S xy = 25 000 cuando x se mide en milímetros y 0.025 cuando 
x está expresada en kilómetros. Una condición razonable para imponer cualquier medida de 
qué tan fuerte es la relación entre x y y es que la medida calculada no deberá depender 
de las unidades particulares utilizadas para medirlas. Esta condición se cumple modificando 
S xx para obtener el coeficiente de correlación muestral. 


El coeficiente de correlación muestral para los pares n (x ,, y,),. . ., (x n , y n ) es 


VlMi ~ U'VlX'V; “ yf ^xx^yy 


( 12 . 8 ) 


Una evaluación precisa de la productividad del suelo es crítica para una planificación racio¬ 
nal del uso del suelo. Desafortunadamente, como el autor del artículo “Productivity Ratings 
Based on Soil Series” (Prof Geographer, 1980: 158-163) argumenta, no es fácil obtener un 
índice de productividad del suelo aceptable. Una dificultad es que la productividad está de¬ 
terminada en parte por el tipo de cosecha y la relación entre el rendimiento de dos cosechas 
diferentes plantadas en el mismo suelo puede no ser muy fuerte. Como ilustración, el artículo 
presenta los datos adjuntos sobre una cosecha de maíz x y una cosecha de cacahuates y 
(mT/Ha) para ocho tipos diferentes de suelo. 


X 

2.4 

3.4 

4.6 

3.7 

2.2 

3.3 

4.0 

2.1 

y 

1.33 

2.12 

1.80 

1.65 

2.00 

1.76 

2.11 

1.63 


Con Ex¡ = 25.7, Ey¡ = 14.40, Ex 2 = 88.31, Exy, = 46.856 y Ey? = 26.4324, 

Í25 7) 2 

S a = 88.31 - v = 88.31 - 82.56 = 5.75 
(14.40) 2 

S m = 26.4324 - 2 -- = 0.5124 

w 8 

(25.7)(14.40) 

S„ = 46.856 - -- 22 -- = 0.5960 

xy 8 


0.5960 

V5Ü5V0.5124 


= 0.347 


de donde 


r = 






































12.5 Correlación 487 


Propiedades de r 

Las propiedades más importantes de r son las siguientes: 

1. El valor de r no depende de cuál de las dos variables estudiadas es x y cual es y. 

2. El valor de r es independiente de las unidades en las cuales xy y estén medidas. 

3. -1 < r < 1 

4. r = 1 si y sólo si todos los pares (x¡, y¡) quedan en una línea recta con pendiente positiva 
y r = — 1 si y sólo si los pares (x¡, y¡) quedan en una línea recta con pendiente negativa. 

5. El cuadrado del coeficiente de correlación muestral da el valor del coeficiente de deter¬ 
minación que resultaría de ajustar el modelo de regresión lineal simple, en símbolos 
(r) 2 = r 2 . 

La propiedad 1 contrasta con lo que sucede en el análisis de regresión, donde virtual¬ 
mente todas las cantidades de interés (la pendiente estimada, la intersección y estimada, 
s 2 , etc.) dependen de cuál de las variables sea tratada como la variable dependiente. Sin em¬ 
bargo, la propiedad 5 demuestra que la proporción de variación de la variable dependiente 
explicada al ajustar el modelo de regresión lineal simple no depende de cuál variable desem¬ 
peñe este rol. 

La propiedad 2 equivale a decir que r no cambia si cada x¡ es reemplazada por cx¡ y si 
cada y¡ es reemplazada por dy¡ (un cambio en la escala de medición), así como también si ca¬ 
da x¡ es reemplazada por x¡ — a y y¡ por y¡ — b (lo que cambia la ubicación de cero en el 
eje de medición). Esto implica, por ejemplo, que r es el mismo si la temperatura se mide en 
°F o °C. 

La propiedad 3 dice que el valor máximo de r, correspondiente al grado más grande 
posible de relación positiva, es r = 1, mientras que la relación más negativa está identifica¬ 
da con r = — 1. De acuerdo con la propiedad 4, las correlaciones positivas y negativas más 
grandes se obtienen sólo cuando todos los puntos quedan a lo largo de una línea recta. Cual¬ 
quier otra configuración de puntos, aun cuando la configuración sugiere una relación deter- 
minística entre las variables, dará un valor r menor que 1 en magnitud absoluta. Por 
consiguiente, r mide el grado de relación lineal entre las variables. Un valor de r cercano a 
0 no es evidencia de la falta de una fuerte relación, sino sólo de la ausencia de una relación 
lineal, de modo que tal valor de r debe ser interpretado con precaución. La figura 12.20 ilus¬ 
tra varias configuraciones de puntos asociadas con valores diferentes de r. 


a) r cerca de +1 b) r cerca de — 1 



c) r cerca de 0, ninguna d) r cerca de 0, relación 

relación aparente no lineal 


Figura 12.20 Gráficas de puntos con valores diferentes de r. 
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488 CAPÍTULO 12 Regresión lineal simple y correlación 

Una pregunta frecuentemente planteada es “Cuándo se puede decir que existe una co¬ 
rrelación fuerte entre las variables y cuándo es débil? Una regla empírica notable es decir 
que la correlación es débil si 0 < | r | < 0.5, fuerte si 0.8 < r | < 1, y moderada de lo con¬ 
trario. Puede sorprender que r = 0.5 se considere débil, pero r 2 = 0.25 implica que en una 
regresión de y en x, solo 25% de la variación de y observada sería explicada por el modelo. 
En el ejemplo 12.15, la correlación entre la cosecha de maíz y la cosecha de cacahuates se 
describiría como débil. 


Coeficiente de correlación p de una población 
e inferencias sobre correlación 


El coeficiente de correlación r mide qué tan fuerte es la relación entre x y y en la muestra 
observada. Se puede pensar que los pares (x¡, y¡) se sacaron de una población de pares biva- 
riantes, con fix, y) como la distribución de probabilidad conjunta de (X h Y¡). En el capítulo 5, 
el coeficiente de correlación p(X, Y) se definió como 


P = P(X, Y) 


Cov(X Y) 

(T X -(Ty 


donde 


Cov(X, Y) = 


£ £ C* - p-xXy - Fy)p(x, y ) 

* y 

-OO /.00 

J J (x- Px)(y - Py)Kx, y) dx dy 


—OO —OO 


( X , Y) discreto 
(X, Y) continuo 


Si se considera que/Tx, y) describe la distribución de pares de valores dentro de toda la po¬ 
blación, p se transforma en una medida de qué tan fuertemente están relacionadas x y y en 
la población. Propiedades de p análogas a aquellas para r se dieron en el capítulo 5. 

El coeficiente de correlación de la población p es un parámetro o característica de la 
población, exactamente como lo son p. x , p, , cr x y oy, así que se puede utilizar el coeficien¬ 
te de correlación muestral para hacer varias inferencias sobre p. En particular, r es una esti¬ 
mación puntual de p y el estimador correspondiente es 



E(X, - X)(Y¡ ~ Y) 

VlpT - ^) 2 Vi y y, - i 7 ) 2 


Ejemplo 12.16 En algunos lugares, existe una fuerte asociación entre las concentraciones de dos contami¬ 
nantes diferentes. El artículo “The Carbón Component of the Los Angeles Aerosol: Source 
Apportionment and Contributions to the Visibility Budget” (J. Air Pollution Control Fed., 
1984: 643-650) reporta los datos adjuntos sobre concentración de ozono x (ppm) y concen¬ 
tración de carbono secundaria y (p,g/m 3 ). 


X 

0.066 

0.088 

0.120 

0.050 

0.162 

0.186 

0.057 

0.100 

y 

4.6 

11.6 

9.5 

6.3 

13.8 

15.4 

2.5 

11.8 

X 

0.112 

0.055 

0.154 

0.074 

0.111 

0.140 

0.071 

0.110 

y 

8.0 

7.0 

20.6 

16.6 

9.2 

17.9 

2.8 

13.0 


Las cantidades resumidas son n = 16,2^ = 1.656, Xy, = 170.6, Yjx]= 0.196912, YjX i y i = 
20.0397 y Xv 2 = 2253.56, de donde 

20.0397 - (1.656)(170.6)/16 
V0. 196912 - (1.656) 2 /16V2253.56 - (170.6) 2 /16 
2.3826 

= - =0.716 

(0.1597X20.8456) 
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La estimación puntual del coeficiente de correlación de la población p entre la concentra¬ 
ción de ozono y la concentración de carbono secundaria es p = r = 0.716. ■ 

Los intervalos de muestra pequeña y los procedimientos de prueba presentados en los 
capítulos 7-9 se basaron en la suposición de normalidad de la población. Para probar las hi¬ 
pótesis sobre p se debe hacer una suposición análoga sobre la distribución de los pares de 
valores ( x , y ) en la población. Ahora se supone que tanto X como Y son aleatorias, mientras 
que una gran parte del trabajo de regresión se realizó con x fija: 


La distribución de probabilidad conjunta de ( X , Y) está especificada por 

f( x y) = --— c -[((*-Mi)/<ri) 2 -2p(je-)Xi)(y—M.2)/o-io-2+((y-M2)M) ;! 1/r2(l-p :i )] 

277 • CTjCTjVT^ p 2 

— 00 < X < 00 

— oo < y < oo (12.9) 

donde p,, y cr l son la desviación estándar y media de X, y p, 2 y <x 2 son la desviación 
estándar y media de Y;f(x, y) se conoce como distribución de probabilidad normal 
bivariante. 


La distribución normal bivariante es obviamente un tanto complicada, pero para los 
propósitos de este libro sólo se debe tener un conocimiento casual de varias de sus pro¬ 
piedades. La superficie determinada por fix, y) se extiende por completo sobre el plano x, 
y [fix, y) > 0] con apariencia de montículo o campana tridimensional, como se ilustra en 
la figura 12.21. Si se rebana la superficie con cualquier plano perpendicular al plano x, y, 
y se examina la curva dibujada en el “plano de corte”, el resultado es una curva normal. Más 
precisamente, si X = x, se puede demostrar que la distribución (condicional) de Y es normal 
con media p, Y . x = p 2 — pp. x a 2 l<j\ + pcr 2 xlcr í y varianza (1 — p 2 )cr\. Este es exactamente el 
modelo utilizado en la regresión lineal simple con /3 0 = p 9 — pp, l cr 2 /a 1 , /3¡ = pcr 2 /cr l 
y cr 2 = (1 — p 2 )cr| independiente de x. La implicación es que si los pares observados 
(x¡, y¡) en realidad se toman de una distribución normal bivariante, entonces el modelo de 
regresión lineal simple es una forma apropiada de estudiar el comportamiento de Y con x 
fija. Si p = 0, entonces p, Y . x = p.-, independiente de .y; en realidad, cuando p = 0 la función 
de densidad de probabilidad conjunta/(x, y) de (12.9) puede ser factorizada en una parte que 
comprende sólo x una parte que abarca sólo y, lo que implica que X y Y son variables inde¬ 
pendientes. 



f(x, y) 



Figura 12.21 Gráfica de la función de densidad de probabilidad normal bivariante. 

Suponer que los pares se tomaron de una distribución normal bivariante permite probar 
hipótesis sobre p y construir un intervalo de confianza. No existe una forma completamente 
satisfactoria de verificar la factibilidad de la suposición de normalidad bivariante. Una verifi¬ 
cación parcial implica construir dos gráficas de probabilidad normales distintas, una para las x¡ 
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de muestra y otra para las y¡ de muestra, puesto que la normalidad bivariante implica que las 
distribuciones marginales tanto de X como de Y son normales. Si cualquiera de las gráficas 
se aparta sustancialmente de un patrón de línea recta, no se deberán utilizar los siguientes 
procedimientos inferenciales cuando el tamaño de muestra n es pequeño. 


Prueba en cuanto a la ausencia de correlación 

Cuando H 0 \ p = 0 es verdadera, el estadístico de prueba 


„ RVn - 2 


Vi - R 2 

tiene una distribución t con n — 2 grados de libertad. 

Hipótesis alternativa 

Reglón de rechazo para una prueba a nivel a 

H- p> 0 

t & * a ,n- 2 

H-. p< 0 

t ^ ~ t a ,n- 2 

H¿. p + 0 

{ — U/2,«-2 0 t — ~ U/2,i¡-2 

Un valor P basado en n 

te se describió. 

— 2 grados de libertad puede ser calculado como previamen- 



Ejemplo 12.17 


(0 29)V45^2- 
Vi - (0.29) 2 

El valor P correspondiente para una prueba t de dos colas basada en 43 grados de libertad 
es aproximadamente de 0.052 (el artículo citado reportó sólo que el valor P > 0.05). No se 
desearía rechazar la aseveración de que p = 0 al nivel de significación de 0.01 o 0.05. Para 
la muestra de trabajadores expuestos, r = 0.83 y t ~ 6.7, existe una clara evidencia de que 
hay una relación lineal en toda la población de trabajadores expuestos de la cual se selec¬ 
cionó la muestra. ■ 

Como p mide el grado al cual existe una relación lineal entre las dos variables en 
la población, la hipótesis nula //„; p = 0 manifiesta que no existe tal relación de población. 
En la sección 12.3 se utilizó la relación t j 3/V P ara P ro ^ ar en cuanto a una relación lineal 
entre las dos variables en el contexto de análisis de regresión. Resulta que los dos proce¬ 
dimientos de prueba son completamente equivalentes porque rVn — 2/ V I — r 2 = /3/s^. 
Cuando radica sólo en valorar la fuerza de cualquier relación lineal en lugar de ajustarse a 
un modelo y utilizarlo para estimar o predecir, la fórmula del estadístico de prueba que se 
acaba de presentar requiere menos cálculos que la relación t. 


Los efectos neurotóxicos del manganeso son bien conocidos y normalmente son provoca¬ 
dos por la prolongada exposición ocupacional durante largos lapsos de tiempo. En los cam¬ 
pos de higiene ocupacional e higiene ambiental, la relación entre la peroxidación de lípidos, la 
cual es responsable del deterioro de los alimentos y de los daños de tejidos vivos, y la ex¬ 
posición ocupacional no ha sido previamente reportada. El artículo “Lipid Peroxidation in 
Workers Exposed to Manganese” ( Scand. J. Work and Environ. Health , 1996: 381-386) re¬ 
portó datos sobre x = concentración de manganeso en sangre (ppb) y y = concentración 
(/umol/L) de malondialdehído, el cual es el producto estable de la peroxidación de lípidos, 
tanto para una muestra de 22 trabajadores expuestos a manganeso como para una muestra 
de control de 45 individuos. El valor de r para la muestra de control fue de 0.29, por lo que 


O 
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Ejemplo 12.18 
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Otras inferencias sobre p 

El procedimiento para H 0 : p = p 0 cuando p 0 A 0 no es equivalente a cualquier procedimien¬ 
to de análisis de regresión. El estadístico de prueba se basa en una transformación de R lla¬ 
mada transformación de Fisher. 


Cuando (X l5 K,),..., (X n , Y n ) es una muestra de una distribución normal bivariante, la 
variable aleatoria 


1 / 1 + R 

V = - ln - 

2 l 1 - R 


tiene aproximadamente una distribución normal con media y varianza 

1 


( 12 . 10 ) 


i./i+p 


El razonamiento para la transformación es obtener una función de R que tenga una varian¬ 
za independiente de p; éste no sería el caso con R misma. Además, no se deberá utilizar la 
transformación si n es bastante pequeña, puesto que la aproximación no será válida. 


El estadístico de prueba para probar H 0 : p = p 0 es 

V-|ln[(l +PbVd -Pb)] 
Z ~ 1 Nn - 3 


Hipótesis 

alternativa 

Región de rechazo para una prueba a nivel a 


P> Po 

z — z 
<, a 

H- 

P<Po 

Z^-Z a 


P * Po 

0 Z - z n/2 0 z < - z n/2 


Se puede calcular un valor P del mismo modo que para pruebas z previas. 



El artículo “Size Effect in Shear Strength of Large Beams-Behavior and Finite Element Mo- 
delling” {Mag. of Concrete Res., 2005: 497-509) reportó sobre un estudio de varias caracte¬ 
rísticas de grandes vigas de concreto reforzado bajas y profundas probadas hasta la falla. 
Considere los siguientes datos sobre x = resistencia de cubo y y = resistencia de cilindro 
en ambos MPa: 


X 

55.10 

44.83 

46.32 

51.10 

49.89 

45.20 

48.18 

46.70 

54.31 

41.50 

y 

49.10 

31.20 

32.80 

42.60 

42.50 

32.70 

36.21 

40.40 

37.42 

30.80 

X 

47.50 

52.00 

52.25 

50.86 

51.66 

54.77 

57.06 

57.84 

55.22 


y 

35.34 

44.80 

41.75 

39.35 

44.07 

43.40 

45.30 

39.08 

41.89 



Entonces S xx = 361.14, S yy = 488.54, S^ = 322.37, de donde r = 0.761. ¿Proporciona 
este valor una fuerte evidencia para concluir que las dos medidas de resistencia están por lo 
menos moderada y positivamente relacionadas? 
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La interpretación previa de correlación positiva moderada fue 0.5 < p < 0.8, así que 
se desea probar H 0 : p = 0.5 contra // a : p > 0.5. El valor calculado de V es entonces 

1 + 0.761' 

y 


v = 0.5 lnl 


1 - 0.761 


= 0.999, 


0.5 lnl 


1 + 0.5 


1 - 0.5 


= 0.549 


Por consiguiente z — (0.999 — 0.549) V I 9 — 3 = 1.80. El valor P para una prueba de cola 
superior es 0.0359. La hipótesis nula por consiguiente puede ser rechazada a un nivel de sig¬ 
nificación de 0.05 pero no al nivel de 0.01. El último resultado en algo más sorprendente a 
la luz de la magnitud de r, pero cuando n es pequeño, puede resultar un parámetro r 
razonablemente grande aun cuando p no sea del todo sustancial. A nivel de significación de 
0.01, la evidencia de una correlación moderadamente positiva no es convincente. ■ 


Para obtener un intervalo de confianza para p, primero se deriva un intervalo para 
p. v = \ ln[(l + p)/(l — p)]. Estandarizando V, escribiendo una proposición de probabilidad 
y manipulando las desigualdades resultantes se obtiene 

—jgg= ,v + (12.11) 

Vn-3 Vn - 3 ) 

como intervalo de 100(1 — a)% para p . v , donde v = \ ln[(l + r)/(l — r)]. Este intervalo 
puede entonces ser manipulado para dar un intervalo de confianza para p. 



Un intervalo de confianza de 100(1 — a)% para p es 

/ e lc ' — 1 e 2ci — 1 \ 

\ e 2c > + 1 ’ e 2ci + 1 / 

donde c¡ y c 2 son los puntos extremos izquierdo y derecho, respectivamente, del in¬ 
tervalo (12.11). 



Ejemplo 12.19 


El artículo “A Study of a Partial Nutrient Removal System for Wastewater Treatment Plants” 
(Water Research, 1972: 1389-1397) reporta sobre un método de eliminación de nitrógeno 
que implica el tratamiento del sobrenadante de un digestor aeróbico. Tanto el nitrógeno to¬ 
tal afluente x (mg/L) como el porcentaje de nitrógeno eliminado se registraron durante 
20 días, con los siguientes estadísticos resultantes = 285.90, Xxj = 4409.55, £y¡ = 
690.30, Xyj = 29040.29 y X q>’, = 10 818.56. El coeficiente de correlación muestral entre 
el nitrógeno afluente y el porcentaje de nitrógeno eliminado es r = 0.733 y se obtiene 
n = 0.935. Con n = 20, un intervalo de confianza de 95% para p. v (0.935 — 1.96/Vl7,0.935 
+ 1.96A/L7) = (0.460, 1.410) = (c I( c 2 ). El intervalo de 95% para p es 


- g 2(0.46)_J ¿2(1.41) _ l - 

e 2(0A6> + 1 ’ e 2(1A1) + 1 


(0.43, 0.89) 


En el capítulo 5, se advirtió que un valor grande del coeficiente de correlación (cerca¬ 
no a 1 o —1) implica sólo asociación y no causalidad. Esto es válido tanto para p como r. 


EJERCICIOS Sección 12.5 (57-67) 


57. El artículo “Behavioural Effects of Mobile Telephone Use 
During Simulated Driving” (Ergonomics , 1995: 2536-2562) 
reportó que para una muestra de 20 sujetos experimentales, 
el coeficiente de correlación muestral con x = edad y y = 
tiempo desde que el sujeto obtuvo una licencia de manejo 


(años) fue 0.97. ¿Por qué piensa que el valor de r se aproxima 
tanto a uno? (Los autores del artículo dieron una explicación.) 

58. El Turbine Oil Oxidation Test (TOST) y el Rotating Bomb 
Oxidation Test (RBOT) son dos procedimientos diferentes 
de evaluar la estabilidad ante la oxidación de aceites para 
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turbina de vapor. El artículo “Dependence of Oxidation Sta- 
bility of Steam Turbine Oil on Base Oil Composition” (J. of 
the Society of Tribologists and Lubrication Engrs., octu¬ 
bre de 1997: 19-24) reportó las observaciones adjuntas sobre 
x = tiempo para realizar TOST (h) y y = tiempo para rea¬ 
lizar RBOT (min) con 12 especímenes de aceite. 


TOST 

4200 

3600 

3750 

3675 

4050 

2770 

RBOT 

370 

340 

375 

310 

350 

200 

TOST 

4870 

4500 

3450 

2700 

3750 

3300 

RBOT 

400 

375 

285 

225 

345 

285 


a. Calcule e interprete el valor del coeficiente de correla¬ 
ción muestral (como lo hicieron los autores del artículo). 

b. ¿Cómo se vería afectado el valor de r si se hubiera hecho 
x = tiempo para realizar RBOT y y = tiempo para rea¬ 
lizar TOST? 

c. ¿Cómo se vería afectado el valor de r si el tiempo para 
realizar RBOT estuviera expresado en horas? 

d. Construya gráficas de probabilidad normal y comente. 

e. Realice una prueba de hipótesis para decidir si el tiem¬ 
po para realizar RBOT y el tiempo para realizar TOST 
están linealmente relacionados. 

59. La tenacidad y fibrosidad de los espárragos son determinan¬ 
tes importantes de su calidad. Éste fue el enfoque de un es¬ 
tudio reportado en “Post-Harvest Glyphosphate Application 
Reduces Toughening, Fiber Content, and Lignification of 
Stored Asparagus Spears” (J. of the Amer. Soc. of Horticul¬ 
tura! Science, 1988: 569-572). El artículo reportó los datos 
adjuntos (tomados de una gráfica) sobre x = fuerza cortan¬ 
te (kg) y y = porcentaje de peso de fibra en seco. 


X 

46 

48 

55 

57 

60 

72 

81 

85 

94 

y 

2.18 

2.10 

2.13 

2.28 

2.34 

2.53 

2.28 

2.62 

2.63 

X 

109 

121 

132 

137 

148 

149 

184 

185 

187 

y 

2.50 

2.66 

2.79 

2.80 

3.01 

2.98 

3.34 

3.49 

3.26 


n = 18, E*¡ = 1950, Ex? = 251 970, 

Ey, = 47.92, Ey? = 130.6074, E*¿y¡ = 5530.92 

a. Calcule el valor del coeficiente de correlación muestral. 
Basado en este valor, ¿cómo describiría la naturaleza de 
la relación entre las dos variables? 

b. Si un primer espécimen tiene un valor más grande de 
fuerza cortante que un segundo espécimen, ¿qué tiende a 
ser cierto del porcentaje de peso de fibra en seco para los 
dos especímenes? 

c. Si la fuerza cortante se expresa en libras, ¿qué le pasa al 
valor de rl ¿Por qué? 

d. Si el modelo de regresión lineal simple fuera ajustado a 
estos datos, ¿qué proporción de la variación observada 
en porcentaje de peso de fibra en seco podría ser expli¬ 
cada por la relación de modelo? 

e. Realice una prueba a un nivel de significación de 0.01 
para decidir si existe una asociación lineal positiva entre 
las dos variables. 

60. El artículo “A Dual-Buffer Titration Method for Lime Re- 

quirement of Acid Mine-soils” ( J. of Environ. Qual., 1988: 

452-456) reporta sobre los resultados de un estudio en rela- 
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ción con la reforestación del suelo en sitios de restauración 
de minas. Con x = KC1 aluminio extraíble y y = cantidad de 
cal requerida para llevar el pH del suelo a 7.0, los datos que 
aparecen en el artículo dieron por resultado las siguientes 
cantidades resumidas: n = 24, 2x = 48.15, Zx 2 = 
155.4685, Zy = 263.5, Zf = 3750.53 y Zxy = 658.455. 
Realice una prueba a un nivel de significación de 0.01 para 
ver si el coeficiente de correlación de la población es un va¬ 
lor diferente de 0. 

61. Los autores del artículo “Objective Effects of a Six Months’ 
Endurance and Strength Training Program in Outpatients 
with Congestive Heart Failure” ( Medicine and Science in 
Sports and Exercise, 1999: 1102-1107) presentó un análisis 
de correlación para investigar la relación entre el nivel de 
lactato máximo x y la resistencia muscular y. Los datos ad¬ 
juntos se tomaron de una gráfica incluida en el artículo. 



400 

750 

770 

800 

850 

1025 

1200 

y 

3.80 

4.00 

4.90 

5.20 

4.00 

3.50 

6.30 


1250 

1300 

1400 

1475 

1480 

1505 

2200 

y 

6.88 

7.55 

4.95 

7.80 

4.45 

6.60 

8.90 


5^ = 36.9839, 5^ = 2628 930.357, 5^ = 7377.704. Una 
gráfica de puntos muestra un patrón lineal. 

a. Realice una prueba para ver si existe una correlación 
positiva entre el nivel de lactato máximo y la resistencia 
muscular en la población de la cual se seleccionaron es¬ 
tos datos. 

b. Si se tuviera que realizar un análisis de regresión para pre¬ 
decir resistencia a consecuencia del nivel de lactato, ¿qué 
proporción de variación observada en la resistencia podría 
ser atribuida a la relación lineal aproximada? Responda la 
pregunta análoga si se utiliza regresión para predecir el 
nivel de lactato a partir de la resistencia, y responda am¬ 
bas preguntas sin que realice ningún cálculo de regresión. 

62. Se conjetura que el contenido de hidrógeno es un factor im¬ 
portante en la porosidad de piezas fundidas de aleación de 
aluminio. El artículo “The Reduced Pressure Test as a Mea- 
suring Tool in the Evaluation of Porosity/Hydrogen Content 
in Al-7 Wt Pct Si-10 Vol Pct SiC(p) Metal Matrix Compo- 
site” (Metallurgical Trans., 1993: 1857-1868) da los datos 
adjuntos sobre x = contenido y y = porosidad al gas para 
una técnica de medición particular. 


X 

0.18 

0.20 

0.21 

0.21 

0.21 

0.22 

0.23 

y 

0.46 

0.70 

0.41 

0.45 

0.55 

0.44 

0.24 

X 

0.23 

0.24 

0.24 

0.25 

0.28 

0.30 

0.37 

y 

0.47 

0.22 

0.80 

0.88 

0.70 

0.72 

0.75 


MINITAB da los siguientes resultados en respuesta al co¬ 
mando de CORRELATION: 

Correlation of Hydrcon and 
Porosity = 0.449 

a. Pruebe a un nivel de 0.05 para ver si el coeficiente de co¬ 
rrelación de la población difiere de 0. 

b. Si se hubiera realizado un análisis de regresión lineal 
simple, ¿qué porcentaje de la variación observada en la 
porosidad podría ser atribuida a la relación de modelo? 
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63. Se investigaron las propiedades físicas de seis muestras de 
tela retardante a las llamas en el artículo “Sensory and Physi- 
cal Properties of Inherently Flame-Retardant Fabrics” (Textíle 
Research , 1984: 61-68. Use los datos adjuntos y un nivel de 
significación de 0.05 para determinar si existe una relación li¬ 
neal entre la rigidez x (mg-cm) y espesor y (mm). ¿Es sorpren¬ 
dente el resultado de la prueba a la luz del valor de rl 


X 

7.98 

24.52 

12.47 

6.92 

24.11 

35.71 

y 

0.28 

0.65 

0.32 

0.27 

0.81 

0.57 


64. El artículo “Increases in Steroid Binding Globulins Induced 
by Tamoxifen in Patients with Carcinoma of the Breast” 
( J. Endocrinology, 1978: 219-226) reporta datos sobre los 
efectos de la droga tamoxifeno en el cambio del nivel de 
globulina afín al cortisol (CBG, por sus siglas en inglés, 
cortisol-binding globulin) de pacientes durante el tratamien¬ 
to. Con la edad = ry ACBG = y, los valores resumidos son 
n = 26, Ex,. = 1613, E(x¡ - x) 2 = 3756.96, Ey,- = 281.9, 
E(y. - yf = 465.34 y Ex,y,. = 16731. 

a. Calcule un intervalo de confianza de 90% para el coefi¬ 
ciente de correlación verdadero p. 

b. Pruebe H 0 : p = —0.5 contra p < —0.5 al nivel de 0.05. 

c. En un análisis de regresión de y en relación con x, ¿qué 
proporción de la variación del cambio del nivel de glo¬ 
bulina afín al cortisol podría ser explicado por la varia¬ 
ción de la edad del paciente dentro de la muestra? 

d. Si decide realizar un análisis de regresión con la edad 
como variable dependiente, ¿qué proporción de la varia¬ 
ción de la edad es explicable por la variación del 
ABCG? 

65. El artículo “Chronological Trend in Blood Lead Levels” (N. 
Engl. J. Med., 1983: 1373-1377) da los siguientes datos so¬ 
bre y = promedio del nivel de plomo en la sangre de niños 
blancos de seis meses a cinco años y x = cantidad de plo¬ 
mo utilizado en la producción de gasolina (en 1000 tonela¬ 
das) durante diez periodos de seis meses: 


X 

48 

59 

79 

80 

95 

y 

9.3 

11.0 

12.8 

14.1 

13.6 

X 

95 

97 

102 

102 

107 

y 

13.8 

14.6 

14.6 

16.0 

18.2 


a. Construya gráficas de probabilidad normales distintas 
para x y y. ¿Piensa que es razonable suponer que los pa¬ 
res (x, y) provienen de una población normal bivariante? 


b. ¿Proporcionan los datos suficiente evidencia para con¬ 
cluir que existe una relación lineal entre el nivel de plo¬ 
mo en la sangre y la cantidad de plomo utilizado en la 
producción de gasolina? Use a = 0.01. 

66. Considere una serie de tiempo, es decir, una secuencia de 
observaciones X v X 2 , . . . obtenidas durante el transcurso 
del tiempo, con valores observados x¡, x 2 , . . . , x„. Suponga 
que la serie no muestra tendencia hacia arriba o hacia aba¬ 
jo durante el transcurso del tiempo. Un investigador con 
frecuencia deseará saber qué tan fuertemente están relaciona¬ 
dos los valores en la serie separados por un número especifi¬ 
cado de unidades de tiempo. El coeficiente de autocorrelacion 
maestral correspondiente a un retardo r 1 es simplemente el 
valor del coeficiente de correlación muestral r de los pares 
(x h x 2 ), (x 2 , x 3 ), . . . , (x„_!, x„), es decir, pares de valo¬ 
res separados por una unidad de tiempo. Asimismo, el coe¬ 
ficiente de autocorrelacion muestral correspondiente a dos 
retardos r, es r para los n — 2 pares (x 1; x 3 ), (x 2 , x 4 ), . . . , 

(*„—2> -O- 

a. Calcule los valores de r t , r 2 y r 3 para los datos de tem¬ 
peratura del ejercicio 82 del capítulo 1 y comente. 

b. Análogo al coeficiente de correlación de la población p, 
sean p¡, p„ . . . los coeficientes de autocorrelacion teóri¬ 
cos o de largo plazo con los varios retardos. Si todos es¬ 
tos p son 0, no existe relación (lineal) con cualquier 
retraso. En este caso, si n es grande, cada R¡ tiene apro¬ 
ximadamente una distribución normal con media 0 y des¬ 
viación estándar 1 A/h y los R¡ diferentes son casi 
independientes. Por consiguiente H 0 \ p¡ = 0 puede ser re¬ 
chazada a un nivel de significación de aproximadamente 
0.05 si r¡ a 2 !\fn o r¡ £ -2 ,/Vñ. ¿Si n = 100 y r x = 
0.16, r 2 = —0.09 y r 3 = —0.15, existe alguna evidencia 
de autocorrelacion teórica con los primeros tres retrasos? 

c. Si prueba simultáneamente la hipótesis nula del inciso b) 
con más de un retraso, ¿por qué podría desear incremen¬ 
tar la constante de corte 2 en la región de rechazo? 

67. Se recopiló una muestra de n = 500 pares (x, y) y se reali¬ 
zó una prueba de H 0 \ p = 0 contra // a : p # 0. El valor P 
resultante se calculó como 0.00032. 

a. ¿Qué conclusión sería apropiada a nivel de significación 
de 0.001? 

b. ¿Indica este pequeño valor P que existe una relación 
muy fuerte entre x y y (un valor de p que difiera consi¬ 
derablemente de 0)? Explique. 

c. Suponga ahora que una muestra de n = 10 000 pares 
(x, y) dio por resultado r = 0.022. Pruebe H 0 : p = 0 con¬ 
tra H á : p ¥= 0 a un nivel de 0.05. ¿Es el resultado estadís¬ 
ticamente significativo? Comente sobre la significación 
práctica de su análisis. 


EJERCICIOS SUPLEMENTARIOS (68-87) 


68. El avalúo de un almacén puede parecer sencillo en compa¬ 
ración con otras asignaciones de avalúo. El avalúo de un 
almacén implica comparar una edificación que es principal¬ 
mente un armazón abierto con otros edificios semejantes. 
Sin embargo, sigue habiendo varios atributos de un almacén 
que están posiblemente relacionados con el valor apreciado. 


El artículo “Challenges In Appraising ‘Simple’ Warehouse 
Properties” (Donald Sonneman, The Appraisal Journal, 
abril de 2001, 174-178) dio los datos adjuntos sobre la altu¬ 
ra del armazón (pies), el cual determina qué tan alto pueden 
ser apilados los productos almacenados y el precio de venta 
($) por pie cuadrado. 
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Altura: 12 

14 14 15 

15 

16 

18 

22 

22 

24 

Precio: 35.53 

37.82 36.90 40.00 38.00 

37.50 41.00 

48.50 

47.00 47.50 

Altura del 








armazón: 

24 26 26 

27 

28 

30 

30 

33 

36 


Precio de venta: 46.20 50.35 49.13 48.07 50.90 54.78 54.32 57.17 57.45 

a. ¿Es el caso que la altura del armazón y el precio de venta 
están “determinísticamente” relacionados, es decir, que el 
precio de venta está determinado por completo y única¬ 
mente por la altura del armazón? [ Sugerencia : Examine 
los datos.] 

b. Construya una gráfica de puntos de los datos. ¿Qué su¬ 
gieren? 

c. Determine la ecuación de la línea de mínimos cuadrados. 

d. Dé una predicción puntual del precio cuando la altura 
del armazón es de 27 pies y calcule el residuo corres¬ 
pondiente. 

e. ¿Qué porcentaje de la variación observada del precio de 
venta puede ser atribuido a la relación lineal aproxima¬ 
da entre la altura del armazón y el precio? 

69. Remítase al ejercicio previo, el cual dio datos sobre alturas 
de armazones para una muestra de almacenes y los precios de 
venta correspondientes. 

a. Estime el cambio promedio verdadero del precio de ven¬ 
ta asociado con un pie de incremento de la altura del ar¬ 
mazón y hágalo de modo que dé información sobre la 
precisión de la estimación. 

b. Estime el precio de venta verdadero de todos los almace¬ 
nes cuya altura de armazón es de 25 pies y hágalo de mo¬ 
do que dé información sobre la precisión de la estimación. 

c. Pronostique el precio de venta de un solo almacén cuya 
altura de armazón es de 25 pies y hágalo de modo que 
dé información sobre la precisión de la predicción. ¿Có¬ 
mo se compara esta predicción con la estimación de b)? 

d. Sin calcular ningún intervalo, ¿cómo se compararía el 
ancho de un intervalo de predicción de 95% con el pre¬ 
cio de venta cuando la altura del armazón es de 25 pies 
con el ancho de un intervalo de 95% cuando la altura es de 
30 pies? Explique su razonamiento. 

e. Calcule e interprete el coeficiente de correlación muestral. 

70. Con frecuencia, a los científicos forenses les interesa reali¬ 
zar alguna clase de medición en un cuerpo (vivo o muerto) 
y luego utilizarla como base para inferir algo sobre la edad 
del cueipo. Considere los datos adjuntos sobre edad (años) y 
% de ácido aspértico D (de aquí en adelante %DAA) de una 
pieza dental particular (“An Improved Method for Age at 
Death Determination from the Measurements of D-Aspertic 
Acid in Dental Collagen”, Archaeometry , 1990: 61-70.) 

Edad: 9 10 11 12 13 14 33 39 52 65 69 

%DAA: 1.13 1.10 1.11 1.10 1.24 1.31 2.25 2.54 2.93 3.40 4.55 

Suponga que una pieza dental de otro individuo tiene 
2.01 %DAA. ¿Podría ser que el individuo tenga menos de 
22 años? Esta pregunta era pertinente para considerar si el 
individuo podía o no ser sentenciado a cadena perpetua por 
homicidio. 

Una estrategia aparentemente sensible es retroceder la 
edad en %DAA y entonces calcular un intervalo de predic¬ 
ción para la edad cuando %DAA = 2.01. No obstante, es 
más natural en este caso considerar la edad como la varia¬ 
ble independiente x y el %DDA como la variable depen¬ 


diente y, así que el modelo de regresión es %DAA = j3 0 + jSpt 
+ e. Después de estimar los coeficientes de regresión, se pue¬ 
de sustituir v* = 2.01 en la ecuación estimada y luego resol¬ 
verla para una predicción de edad.?. Este uso ‘‘inverso” de 
la línea de regresión se llama “calibración”. Un intervalo 
de predicción para edad con nivel de predicción aproxima¬ 
damente de 100(1 — a)% esx ± t a/2n _ 2 ' SE donde 



(x - x) 2 1/2 


Calcule este intervalo de predicción para y* = 2.01 y luego 
aborde la pregunta previamente planteada. 

71. Los datos adjuntos sobre x = tasa de consumo de diesel me¬ 
dida por el método pesaje de drenaje y y = tasa medida por 
el método de trazado de intervalo de confianza, ambos en 
g/h, se tomaron de una gráfica incluida en el artículo “A 
New Measurement Method of Diesel Engine Oil Consump- 
tion Rate” ( J. Society Auto Engr., 1985: 28-33). 


X 

4 

5 

8 

11 

12 

16 

17 

20 

22 

28 

30 

31 

39 

y 

5 

7 

10 

10 

14 

15 

13 

25 

20 

24 

31 

28 

39 


a. Suponiendo que x y y están relacionadas por el modelo 
de regresión lineal simple, realice una prueba para deci¬ 
dir si es factible que en promedio el cambio de la tasa 
medida por el método de trazado de intervalo de con¬ 
fianza sea idéntico al cambio de la tasa medido median¬ 
te el método de pesaje de drenaje. 

b. Calcule e interprete el valor del coeficiente de correla¬ 
ción muestral. 

72. Los resultados SAS que aparecen en la siguiente página es¬ 
tán basados en datos tomados del artículo “Evidence for 
and the Rate of Denitrification in the Arabian Sea” (Deep 
Sea Research, 1978: 431-435). Las variables estudiadas son 
x = nivel de salinidad (%) y y = nivel de nitrato (p,M/L). 

a. ¿Cuál es el tamaño de muestra ni [ Sugerencia : Busque 
los grados de libertad para SCE.] 

b. Calcule una estimación puntual del nivel de nitrato espe¬ 
rado cuando el nivel de salinidad es de 35.5. 

c. ¿Parece haber una relación lineal útil entre las dos variables? 

d. ¿Cuál es el valor del coeficiente de correlación muestral? 

e. ¿Utilizaría el modelo de regresión lineal simple para 
sacar conclusiones cuando el nivel de salinidad es de 40? 

73. La presencia de carburos de aleación duros en aleaciones de 
hierro blanco al alto cromo produce una excelente resisten¬ 
cia a la abrasión, lo que las hace apropiadas para el manejo 
de materiales en las industrias mineras y de procesamiento de 
materiales. Los datos adjuntos sobre x = contenido de auste- 
nita retenido (%) y y = pérdida por desgaste abrasivo (mm 3 ) 
en prueba de desgaste de alfileres con granate como el abra¬ 
sivo se tomaron de una gráfica que aparece en el artículo 
“Microstructure-Property Relationships in High Chromium 
White Iron Alloys” (Intl. Materials Reviews, 1996: 59-82). 


X 

4.6 

17.0 

17.4 

18.0 

18.5 

22.4 

26.5 

30.0 

34.0 

y 

0.66 

0.92 

1.45 

1.03 

0.70 

0.73 

1.20 

0.80 

0.91 

X 

38.8 

48.2 

63.5 

65.8 

73.9 

77.2 

79.8 

84.0 


y 

1.19 

1.15 

1.12 

1.37 

1.45 

1.50 

1.36 

1.29 
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496 CAPÍTULO 12 Regresión lineal simple y correlación 

Resultados obtenidos con SAS para el ejercicio 72 

Dependent Variable: NITRLVL 


Analysis of Variance 


Source 

DF 

Sum of Squares 

Mean Square 

SS 

Resid 





F Valué 

Prob > F 

Model 

1 

64.49622 

64.49622 

63.309 

0.0002 

Error 

6 

6.11253 

1.01875 



C Total 

7 

70.60875 





Root MSE 

1.00933 

R-square 0.9134 




Dep Mean 

26.91250 

Adj R-sq 0.8990 




C.V. 

3.75043 






Parameter Estimates 





Parameter 

Standard 

T for HO: 


Variable 

DF 

Estimate 

Error 

Parameter = 0 

Prob > : T: 

INTERCEP 

1 

326.976038 

37.71380243 

8.670 

0.0001 

SALINITY 

1 

- 8.403964 

1.05621381 

- 7.957 

0.0002 


Use los datos y los resultados obtenidos con SAS propor¬ 
cionados a continuación para responder las siguientes pre¬ 
guntas. 

a. ¿Qué proporción de la variación observada de pérdida 
por desgaste puede ser atribuida a la relación de modelo 
de regresión lineal simple? 

b. ¿Cuál es el valor del coeficiente de correlación muestral? 

c. Pruebe la utilidad del modelo de regresión lineal simple 
con a = 0.01. 

d. Estime la pérdida por desgaste promedio verdadera 
cuando el contenido es de 50% y hágalo de modo que dé 
información sobre confiabilidad y precisión. 

e. ¿Qué valor de pérdida por desgaste predeciría cuando el 
contenido es de 30% y cuál es valor del residuo corres¬ 
pondiente? 


74. Los datos adjuntos se leyeron en una gráfica de puntos del 
artículo “Urban Emissions Measured with Aircraft” (/ of 
the Air and Waste Mgmt. Assoc., 1998: 16-25). La variable 
de respuesta es ANO v y la variable explicativa es ACO. 


ACO 

50 

60 

95 

108 

135 

ano,, 

2.3 

4.5 

4.0 

3.7 

8.2 

ACO 

210 

214 

315 

720 


ano v 

5.4 

7.2 

13.8 

32.1 



a. Adapte un modelo apropiado a los datos y juzgue la uti¬ 
lidad del modelo. 

b. Pronostique el valor de ANO,, que se obtendría al reali¬ 
zar una observación más cuando ACO es 400 y hágalo 
de modo que dé información sobre precisión y confiabi¬ 
lidad. ¿Parece que el ANO,, puede ser pronosticado con 
precisión? Explique. 


Resultados obtenidos con SAS para el ejercicio 73 


Dependent Variable: ABRLOSS 

Analysis of Variance 


Source 

DF 

Sum of Squares 

Mean Square 

F Valué 

Prob > F 

Model 

1 

0.63690 

0.63690 

15.444 

0.0013 

Error 

15 

0.61860 

0.04124 



C Total 

16 

1.25551 





Root MSE 

0.20308 

R-square 0.5073 




Dep Mean 

1.10765 

Adj R-sq 0.4744 




C.V. 

18.33410 






Parameter Estimates 





Parameter 

Standard 

T for H0: 


Variable 

DF 

Estimate 

Error 

Parameter = 0 

Prob > | T | 

INTERCEP 

1 

0.787218 

0.09525879 

8.264 

0.0001 

AUSTCONT 

1 

0.007570 

0.00192626 

3.930 

0.0013 
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c. El valor más grande de ACO es mucho más grande que 
los demás valores. ¿Ha tenido esta observación un im¬ 
pacto sustancial en la ecuación adaptada? 

75. Se estudió la relación entre la velocidad (pies/s) y la caden¬ 
cia al correr (número de pasos/s) entre corredoras de mara¬ 
tón. Las cantidades resumidas resultantes fueron « = 11, 
2(velocidad) = 205.4, 2(velocidad) 2 = 3880.08,2(caden- 
cia) = 35.16, 2(cadencia) 2 = 112.681 y d(velocidad/ca- 
dencia) = 660.130. 

a. Calcule la ecuación de la recta de mínimos cuadrados 
que utilizaría para predecir la cadencia a partir de la ve¬ 
locidad. 

b. Calcule la ecuación de la recta de mínimos cuadrados 
que utilizaría para predecir la velocidad a partir de la ca¬ 
dencia. 

c. Calcule el coeficiente de determinación para la regre¬ 
sión de la cadencia basada en la velocidad del inciso a) 
y para la regresión de la velocidad basada en la cadencia 
del inciso b). ¿Cómo están relacionadas? 

76. “Mezclabilidad de modos” se refiere a cuánto de la propaga¬ 
ción de grietas es atribuible a los tres modos de fractura con¬ 
vencionales de abertura, deslizamiento o desgarro. Para 
problemas de aviones, sólo los dos primeros modos están 
presentes y el ángulo de mezclabilidad de modos mide el 
grado al cual la propagación se debe a deslizamiento en opo¬ 
sición a abertura. El artículo “Increasing Allowable Flight 
Loads by Improved Structural Modeling” ( AIAA J., 2006: 
376-381) dio los siguientes datos sobre x = ángulo de mez¬ 
clabilidad de modos (grados) y y — tenacidad a la fractura 
(N/m) de paneles utilizados en la construcción de aviones. 



16.52 

17.53 

18.05 

18.50 

22.39 

23.89 

25.50 

24.89 

y 

609.4 

443.1 

577.9 

628.7 

565.7 

711.0 

863.4 

956.2 

X 

23.48 

24.98 

25.55 

25.90 

22.65 

23.69 

24.15 

24.54 

y 

679.5 

707.5 

767.1 

817.8 

702.3 

903.7 

964.9 

1047.3 


a. Obtenga la ecuación de la recta de regresión estimada y 
discuta el grado al cual el modelo de regresión lineal 
simple es una forma razonable de relacionar la tenacidad 
a la fractura con el ángulo de mezclabilidad de modos. 

b. ¿Sugieren los datos que el cambio promedio de la tena¬ 
cidad a la fractura asociado con un incremento de un 
grado del ángulo de mezclabilidad de modos excede de 
50 N/m? Realice una prueba apropiada de hipótesis. 

c. Para propósitos de estimación con precisión de la pen¬ 
diente de la recta de regresión de la población, ¿hubiera 
sido preferible realizar observaciones a los ángulos 16, 
16, 18, 18, 20, 20, 20, 20, 22, 22, 22, 22, 24, 24, 26 y 26 
(de nuevo un tamaño de muestra de 16)? Explique su ra¬ 
zonamiento. 

d. Calcule una estimación de tenacidad a la fractura pro¬ 
medio verdadera y también una predicción de tenacidad 
a la fractura tanto para un ángulo de 18 grados como para 
un ángulo de 22 grados y hágalo de modo que dé infor¬ 
mación sobre confiabilidad y precisión y luego interpre¬ 
te y compare las estimaciones y predicciones. 

77. El artículo “Photocharge Effects in Dye Sensitized Ag[Br,I] 
Emulsions at Millisecond Range Exposures” (Photographic 
Sci. and Engr., 1981: 138-144) da los datos adjuntos sobre 
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x = % de absorción de luz a 5800 A y y = fotovoltaje 
máximo. 


X 

4.0 

8.7 

12.7 

19.1 

21.4 

y 

0.12 

0.28 

0.55 

0.68 

0.85 

X 

24.6 

28.9 

29.8 

30.5 


y 

1.02 

1.15 

1.34 

1.29 



a. Construya una gráfica de puntos de estos datos. ¿Qué 
sugieren? 

b. Suponiendo que el modelo de regresión lineal simple es 
apropiado, obtenga la ecuación de la recta de regresión 
estimada. 

c. ¿Qué proporción de la variación observada del fotovoltaje 
máximo puede ser explicado por la relación de modelo? 

d. Pronostique el fotovoltaje máximo cuando el % de ab¬ 
sorción es de 19.1 y calcule el valor del residuo corres¬ 
pondiente. 

e. Los autores del artículo manifiestan que existe una rela¬ 
ción lineal útil entre el % de absorción y el fotovoltaje 
máximo. ¿Está de acuerdo? Realice una prueba formal. 

f. Dé una estimación del cambio del fotovoltaje máximo 
esperado asociado con un incremento de 1% de la absor¬ 
ción de luz. Su estimación deberá informar sobre la pre¬ 
cisión de la estimación. 

g. Repita el inciso f) del valor esperado del fotovoltaje 
máximo cuando el % de absorción de luz es de 20. 

78. En la sección 12.4, se presentó una fórmula para V(0 O + jSpt*) 
y un intervalo de confianza para j8 0 + P¡x*. Considerando 
x* = 0 se obtiene oj y un intervalo de confianza para jS 0 . 
Use los datos del ejemplo 12.11 para calcular la desviación 
estándar estimada de j8 0 y un intervalo de confianza de 95% 
para la intersección y de la línea de regresión verdadera. 

79. Demuestre que SCE = S — la cual da una fórmula 

alternativa para SCE. 

80. Suponga que x y y son variables positivas y que una mues¬ 
tra de n pares da r ~ 1. Si el coeficiente de correlación 
muestral se calcula para los pares (x, y 2 ), ¿será el valor re¬ 
sultante también aproximadamente 1? Explique. 

81. Sean s x y s y las desviaciones estándar muéstrales de las x y y 

observadas, respectivamente [así que s 2 = — x) 2 l 

(n — 1) y asimismo para s 2 ]. 

a. Demuestre que una expresión alternativa para la línea de 
regresión estimada y = j8 0 + ¡3^ es 

V 

y = y + r • —(x — x) 

Le 

b. Esta expresión para la línea de regresión puede ser inter¬ 
pretada como sigue. Suponga r = 0.5. ¿Cuál es entonces 
la y pronosticada con una x situada a una desviación es¬ 
tándar (s x unidades) sobre la media de las x¡l Si r fuera 
una, la predicción sería para que y quede a una desvia¬ 
ción estándar sobre su media v, pero como r = 0.5, se 
pronostica una y que está a sólo 0.5 desviaciones están¬ 
dar (0.5s v unidad) sobre y. Con los datos del ejercicio 64 
para un paciente cuya edad está a una desviación estándar 
por debajo de la edad promedio en la muestra, ¿a cuántas 
desviaciones estándar se pronostica que esté el ACBG 
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498 CAPITULO 12 Regresión lineal simple y correlación 

pronosticado del paciente por encima o por debajo del 
ACBG promedio para la muestra? 

82. Verifique que el estadístico t de prueba para probar H 0 : 
jSj = 0 en la sección 12.3 es idéntico al estadístico t en la 
sección 12.5 para probar H 0 \ p = 0. 

83. Use la fórmula para calcular SCE para comprobar que r 2 = 
1 - SCE/STC. 

84. En la biofiltración de aguas residuales, se hace que el aire 
descargado por una planta de tratamiento pase a través de una 
membrana porosa húmeda que disuelve los contaminantes en 
el agua y los transforma en productos inocuos. Los datos ad¬ 
juntos sobre x = temperatura de entrada (°C) y y = eficien¬ 
cia de eliminación (%) fueron la base para una gráfica de 
puntos que apareció en el artículo “Treatment of Mixed 
Hydrogen Sulfide and Organic Vapors in a Rock Médium 
Biofilter” (Water Environment Research , 2001: 426-435). 


Obs 

Temp 

% de elimi¬ 
nación 

Obs 

Temp 

% de elimi¬ 
nación 

1 

7.68 

98.09 

17 

8.55 

98.27 

2 

6.51 

98.25 

18 

7.57 

98.00 

3 

6.43 

97.82 

19 

6.94 

98.09 

4 

5.48 

97.82 

20 

8.32 

98.25 

5 

6.57 

97.82 

21 

10.50 

98.41 

6 

10.22 

97.93 

22 

16.02 

98.51 

7 

15.69 

98.38 

23 

17.83 

98.71 

8 

16.77 

98.89 

24 

17.03 

98.79 

9 

17.13 

98.96 

25 

16.18 

98.87 

10 

17.63 

98.90 

26 

16.26 

98.76 

11 

16.72 

98.68 

27 

14.44 

98.58 

12 

15.45 

98.69 

28 

12.78 

98.73 

13 

12.06 

98.51 

29 

12.25 

98.45 

14 

11.44 

98.09 

30 

11.69 

98.37 

15 

10.17 

98.25 

31 

11.34 

98.36 

16 

9.64 

98.36 

32 

10.97 

98.45 


Las cantidades calculadas son £x¡ = 384.26, £y¡ = 

3149.04, £x] = 5099.2412, Xx¡y¡ = 37 850.7762 y £y¿ = 
309 892.6548. 

a. Sugieren una gráfica de puntos de los datos la pertinen¬ 
cia del modelo de regresión lineal simple? 

b. Ajuste el modelo de regresión lineal simple, obtenga una 
predicción puntual de la eficiencia de eliminación cuan¬ 
do la temperatura = 10.50 y calcule el valor del residuo 
correspondiente. 

c. Aproximadamente, ¿cuál es el tamaño de una desvia¬ 
ción típica de puntos en la gráfica con respecto a la línea 
de mínimos cuadrados? 

d. ¿Qué proporción de la variación observada de la eficien¬ 
cia de eliminación puede ser atribuida a la relación de 
modelo? 

e. Estime el coeficiente de pendiente de modo que informe 
sobre confiabilidad y precisión e interprete su estima¬ 
ción. 

f. Comunicación personal con los autores del artículo re¬ 
veló que no hubo ninguna observación adicional que no 
estuvo incluida en su gráfica de puntos: (6.53, 96.55). 


¿Qué impacto tiene esta observación adicional en la 
ecuación de la línea de mínimos cuadrados y los valores 
de s y r 2 ? 

85. Los procesos normales de incubación en acuacultura inevi¬ 
tablemente producen tensión en los peces, la cual puede im¬ 
pactar negativamente el crecimiento, reproducción y calidad 
de la carne y susceptibilidad a enfermedades. Tal tensión 
se pone de manifiesto en los elevados y sostenidos niveles 
de corticosteroides. El artículo “Evaluation of Simple Ins¬ 
truments for the Measurement of Blood Glucosa and 
Lactate and Plasma Protein as Stress Indicators in Fish” 
(J. ofthe World Aquaculture Society, 1999: 276-284) descri¬ 
bió un experimento en el cual los peces se sometieron a un 
protocolo de tensión y luego se suspendió y se sometieron a 
prueba en varias ocasiones después de que se aplicó el pro¬ 
tocolo. Los datos adjuntos sobre x = tiempo (min) y y = ni¬ 
vel de glucosa en sangre (mmol/L) se leyeron en la gráfica. 


X 

2 

2 

5 

7 

12 

13 

17 

18 

23 

24 

26 

28 

y 

4.0 

3.6 

3.7 

4.0 

3.8 

4.0 

5.1 

3.9 

4.4 

4.3 

4.3 

4.4 

X 

29 

30 

34 

36 

40 

41 

44 

56 

56 

57 

60 

60 

y 

5.8 

4.3 

5.5 

5.6 

5.1 

5.7 

6.1 

5.1 

5.9 

6.8 

4.9 

5.7 


Use los métodos desarrollados en este capítulo para analizar 
los datos y escriba un breve reporte que resuma sus conclu¬ 
siones (suponga que los investigadores están particularmen¬ 
te interesados en el nivel de glucosa 30 min después de la 
tensión). 

86. El artículo “Evaluating the BOD POD for Assessing Body 
Fat in Collegiate Football Players” ( Medicine and Science 
in Sports and Exercise, 1999: 1350-1356) reporta sobre un 
nuevo dispositivo de desplazamiento de aire para medir la 
grasa corporal. El procedimiento acostumbrado utiliza dis¬ 
positivo hidrostático de pesar, el cual mide el porcentaje de 
masa corporal por medio del desplazamiento del agua. Los 
siguientes son datos representativos tomados de una gráfica 
que aparece en el artículo. 


BOD 

2.5 

4.0 4.1 

6.2 

7.1 

7.0 

8.3 

9.2 

9.3 

12.0 

12.2 

HW 

8.0 

6.2 9.2 

6.4 

8.6 12.2 

7.2 

12.0 

14.9 

12.1 

15.3 

BOD 

12.6 

14.2 

14.4 

15.1 

15 

.2 

16.3 

17.1 

17.9 

17.9 

HW 

14.8 

14.3 

16.3 

17.9 

19 

.5 

17.5 

14.3 

18.3 

16.2 


a. Use varios métodos para decidir si es posible que las dos 
técnicas midan o promedien la misma cantidad de grasa. 

b. Use los datos para desarrollar una forma de predecir un 
peso hidróstatico a partir de una medición BOD POD e 
investigue la efectividad de tales predicciones. 

87. Reconsidere la situación del ejercicio 73, en el cual x = 
contenido de austenita retenida utilizando un abrasivo de 
granate y y = pérdida por desgaste abrasivo se relacionaron 
vía el modelo de regresión lineal simple Y — fi 0 + /3¡jc + e. 
Suponga que con un segundo tipo de abrasivo, estas varia¬ 
bles también están relacionadas vía el modelo de regresión 
lineal simple Y = y Q + ypc +£ y que V(e) = a 2 para am¬ 
bos tipos de abrasivo. Si el conjunto de datos se compone 
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de n l observaciones del primer abrasivo y n, del segundo 
y si SCE¡ y SCE 2 denotan las dos sumas de cuadrados de¬ 
bido al error, entonces una estimación agrupada de a 2 es 
<r 2 = (SCE, + SCE 2 )/(n, + n 2 - 4). Sean SC xl y SC x2 
Sf-V; — x) 2 con los datos del primero y segundo abrasivos, 
respectivamente. Una prueba de H 0 : fi t — = 0 (pendien¬ 

tes iguales) está basada en el estadístico 

Pi ~ 7i 

T = a ¡— + — 

V SQi SQ 2 
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Cuando H 0 es verdadera, T tiene una distribución t con 
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= 0.006845, y SCE, = 0.51350. Usando esto junto con los 
datos del ejercicio 73, realice una pueba en el nivel 0.05 
para ver si el cambio previsto por pérdida en el desgaste 
asociado a 1% de incremento en el contenido de austerita 
es idéntico para los dos tipos de abrasivo. 
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i O Regresión múltiple 
y no lineal 


| INTRODUCCIÓN 

El modelo probabilístico estudiado en el capítulo 12 especificó que el valor observa¬ 
do de la variable dependiente Y se desviaba de la función de regresión lineal fi Y . x = 
/3 0 + ¡3^x en una cantidad aleatoria. Aquí se consideran dos formas de generalizar el 
modelo de regresión lineal simple. La primera es sustituir ¡3 0 + /3,x con una función 
no lineal dex, y la segunda es usar una función de regresión que comprenda más de 
una sola variable Independiente. Después de ajustar una función de regresión de la 
forma seleccionada a la información dada, por supuesto que es importante tener mé¬ 
todos para hacer inferencias acerca de los parámetros del modelo seleccionado. No 
obstante, antes de usar estos métodos el analista de datos debe evaluar primero la 
validez del modelo seleccionado. En la sección 13.1 se estudian estos métodos, con 
base principalmente en un análisis gráfico de los residuos (las y observadas menos las 
pronosticadas), para verificar lo apropiado del modelo ajustado. 

En la sección 13.2 se consideran funciones de regresión no lineales de una so¬ 
la variable Independiente x que son "intrínsecamente lineales". Con esto se quiere 
decir que es posible transformar una o las dos variables para que la relación entre las 
nuevas variables sea lineal. Se obtiene una clase alternativa de relaciones no lineales 
con el uso de funciones de regresión con polinomios de la forma /i y . x = /3 0 + ^x + 
/3 2 x 2 + • ■ • + [3 k x k ; estos modelos con polinomios son el tema de la sección 13.3. El 
análisis de regresión múltiple comprende la construcción de modelos para relacionar 
y con dos o más variables Independientes. El interés principal de la sección 13.4 es¬ 
tá en la interpretación de varios modelos de regresión múltiple y en entender y usar 
la salida de regresión de varios paquetes estadísticos de computadoras. La última sec¬ 
ción del capítulo examina algunas extensiones y dificultades de hacer modelos de re¬ 
gresión múltiple. 
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| 13.1 Aptitud y verificación del modelo 

Una gráfica de los pares observados ( x ¡, y¡) es un primer paso necesario para decidir la for¬ 
ma de una relación matemática entre x y y. Es posible adaptar numerosas funciones distin¬ 
tas a la recta (y = b 0 + b { x) a los datos, usando ya sea el principio de mínimos cuadrados 
u otro método apropiado. Una vez que una función de la forma seleccionada se haya ajus¬ 
tado, es importante verificar el ajuste del modelo para ver si en verdad es apropiado. Una 
forma de estudiar el ajuste es sobreponer una gráfica de la función de mejor ajuste sobre la 
gráfica de puntos de los datos. No obstante, cualquier inclinación o curvatura de la función 
de mejor ajuste puede ocultar algunos aspectos del ajuste que deben investigarse. Además, 
la escala en el eje vertical puede hacer difícil evaluar el grado al que los valores observados 
se desvían de las funciones de mejor ajuste. 


Residuos y residuos estandarizados 

Un método más eficaz de evaluar la exactitud del modelo es calcular los valores ajustados 
o pronosticados y¡ y los residuos e¡ = y¡ — y¡ y luego trazar varias funciones de estas canti¬ 
dades calculadas. A continuación se examinan las gráficas para confirmar la selección de 
modelo o para indicaciones de que el modelo no es apropiado. Suponga que el modelo 
de regresión lineal simple es correcto, y sea y = |S 0 + jSjV la ecuación de la línea de regre¬ 
sión. Entonces el í-ésimo residuo es e¡ = y¡ — (j8 0 + /3|X ; ). Para deducir propiedades de los 
residuos, se representa con e¡ = Y¡ — Y¡ el í-ésimo residuo como una variable aleatoria (va) 
(antes que en realidad se hagan observaciones). Entonces 


E{Y i - f ; ) = E(Y¡) - E(¡3 0 + /3,x,) = |3 0 + jS,*,. - Q3 0 + /3,*¡) = 0 (13.1) 

Debido a que Y¡ (= /3 0 + /3¡x ; ) es una función lineal de las K ( , así lo es Y¡ — Y¡ (los coefi¬ 
cientes dependen de las x). Así, la normalidad de las Y¡ implica que cada residuo está nor¬ 
malmente distribuido. También se puede demostrar que 


V(Y l - Y¡) = a 2 


1 (x¡ — x) 1 

n S„ 


(13.2) 


Si se sustituye cr 2 con .v 2 y se toma la raíz cuadrada de la ecuación (13.2) resulta la desvia¬ 
ción estándar estimada de un residuo. 

Se estandariza ahora cada residuo al restar el valor medio (cero) y luego dividir entre 
la desviación estándar estimada. 


Los residuos estandarizados están dados por 



II 

1 

II 

. , n 


í l--- (x ''- í)2 


(13.3) 

V ” 




Si, por ejemplo, un residuo estandarizado particular es 1.5, entonces el residuo en sí es 1.5 
desviaciones estándares (estimadas) mayor de lo que se esperaría por ajustar el modelo co¬ 
rrecto. Nótese que las varianzas de los residuos difieren entre sí. Si n es razonablemente 
grande, no obstante, el término entre paréntesis rectangulares (13.2) será alrededor de 1, de 
modo que algunas fuentes usan e¡/s como el residuo estandarizado. El cálculo de las e* 
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puede ser tedioso, pero los paquetes computarizados de estadísticas de más uso dan estos 
valores de manera automática y (previa solicitud) pueden construir varias gráficas donde 
esos valores están comprendidos. 

Ejemplo 13.1 El ejercicio 19 del capítulo 12 presentó datos acerca x = tasa de liberación debido a área del 
quemador y y = tasa de emisión de NO x . Aquí se reproducen los datos y los valores ajusta¬ 
dos, residuos y residuos estandarizados. La línea de regresión estimada es y = —45.55 + 
1.71.r yr 1 2 3 4 = 0.961. Observe que los residuos estandarizados no son un múltiplo constante 
de los residuos (es decir, e* A e¡/s). 


x i 

y¡ 

Si 

e i 

e* 

100 

150 

125.6 

24.4 

0.75 

125 

140 

168.4 

-28.4 

-0.84 

125 

180 

168.4 

11.6 

0.35 

150 

210 

211.1 

-1.1 

-0.03 

150 

190 

211.1 

-21.1 

-0.62 

200 

320 

296.7 

23.3 

0.66 

200 

280 

296.7 

-16.7 

-0.47 

250 

400 

382.3 

17.7 

0.50 

250 

430 

382.3 

47.7 

1.35 

300 

440 

467.9 

-27.9 

-0.80 

300 

390 

467.9 

-77.9 

-2.24 

350 

600 

553.4 

46.6 

1.39 

400 

610 

639.0 

-29.0 

-0.92 

400 

670 

639.0 

31.0 

0.99 


Gráficas de diagnóstico 

Las gráficas básicas que numerosos expertos en estadística recomiendan para una evalua¬ 
ción de la validez y utilidad de un modelo son las siguientes: 

1. e* (o e ; ) sobre el eje vertical contra x¡ en el eje horizontal 

2. e* (o e) sobre el eje vertical contra y, en el eje horizontal 

3. y¡ sobre el eje vertical contra y¡ en el eje horizontal 

4. Una gráfica de probabilidad normal de los residuos estandarizados 

Las gráficas 1 y 2 se denominan gráficas de residuos (contra la variable independiente y 
valores ajustados, respectivamente), en tanto que la gráfica 3 está ajustada contra valores ob¬ 
servados. 

Si la gráfica 3 da puntos cercanos a la recta de 45° [pendiente +1 que pasa por (0, 0)], 
entonces la función de regresión estimada da predicciones precisas de los valores que se ob¬ 
servan en realidad. Así, la gráfica 3 proporciona una evaluación visual de la efectividad del 
modelo para hacer predicciones. Siempre que el modelo sea correcto, ninguna gráfica de re¬ 
siduos debe exhibir formas distintas. Los residuos deben estar distribuidos al azar alrededor 
de 0 según una distribución normal, de manera que con excepción de unos cuantos, todos 
los residuos estandarizados deben encontrarse entre —2 y 4-2 (es decir, todos excepto unos 
cuantos a no más de dos desviaciones estándares de su valor esperado de 0). La gráfica de 
residuos estandarizados contra y es en realidad una combinación de las otras dos gráficas, 
mostrando implícitamente la forma en que varían los residuos con x y cómo se comparan 
los valores ajustados con valores observados. Esta última gráfica es la que se recomienda 
con más frecuencia para análisis de regresión múltiple. La gráfica 4 permite al analista eva¬ 
luar la factibilidad de la suposición de que e tiene una distribución normal. 
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Ejemplo 13.2 

(continuación 
del ejemplo 
13.1) 


La figura 13.1 presenta una gráfica de puntos de los datos y las cuatro gráficas recomenda¬ 
das. La gráfica de y en función de y confirma la impresión dada por r 2 de que x es eficaz en 
la predicción de y y también indica que no hay y observada para la que el valor predicho es¬ 
té muy lejos de la marca. Ambas gráficas de residuos no muestran una figura poco común 
ni valores discrepantes. Hay un residuo estandarizado que está ligeramente fuera del inter¬ 
valo (—2, 2), pero esto no es sorprendente en una muestra de tamaño 14. La gráfica de pro¬ 
babilidad normal de los residuos estandarizados es razonablemente recta. En resumen, las 
gráficas no dejan remordimiento acerca de lo apropiado de una relación lineal sencilla o el 
ajuste a la información dada. 
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Figura 13.1 


Gráfica para los datos del ejemplo 13.1. 


Dificultades y soluciones 

Aun cuando se espera que nuestro análisis dé gráficas como las de la figura 13.1, con gran 
frecuencia dichas gráficas sugerirán una o más de las siguientes dificultades: 
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1. Una relación probabilística no lineal entre ryyes apropiada. 

2. La varianza de e (y de Y) no es una cr 1 constante sino que depende de x. 

3. El modelo seleccionado se ajusta bien a los datos, excepto para unos pocos valores dis¬ 
crepantes de datos o resultados aislados, que pueden haber tenido gran influencia en la 
selección de la función de mejor ajuste. 

4. El término de error e no tiene una distribución normal. 

5. Cuando el subíndice i indica el orden de las observaciones en tiempo, las e¡ exhiben de¬ 
pendencia en el tiempo. 

6. Una o más variables independientes relevantes se han omitido del modelo. 

La figura 13.2 presenta gráficas de residuos correspondientes a los elementos 1-3, 5 
y 6. En el capítulo 4, se estudiaron figuras en gráficas de probabilidad normales que arrojan 
duda sobre la suposición de una distribución normal básica. Nótese que los residuos de los 
datos de la figura 13.2d), con el punto circulado incluido, por sí mismos no sugerirían un 
análisis ulterior, pero cuando se ajusta una nueva recta con ese punto borrado, la nueva rec¬ 
ta difiere considerablemente de la recta original. Este tipo de conducta es más difícil de 
identificar en regresión múltiple. Lo más probable es que surja cuando haya un solo pun- 
to(s) de dato (o muy pocos) con valor(es) variable(s) independiente(s) muy alejados del resto 
de los datos. 

A continuación se indica brevemente de qué soluciones se dispone para los tipos de 
dificultades. Para un análisis más completo debe consultarse una o más de las referencias 
sobre análisis de regresión. Si la gráfica de residuos se ve como el de la figura 13.2a), que 
exhibe una figura curva, entonces puede ajustarse una función no lineal de x. 





+2 


_•_ Orden de las_ 

observaciones 

• • • • 

en tiempo 

-2 - 

e) f) 

Figura 13.2 Gráficas que indican anormalidad en datos: a) relación no lineal; b) varianza no 
constante; c) observación discrepante; d) observación con gran influencia; e) dependencia en 
errores; f) variable omitida. 


Variable 

independiente 

omitida 






























cl3_p500-567.qxd 


4:34 AM Page 505 


3/12/08 



13.1 Aptitud y verificación del modelo 505 

La gráfica de residuos de la figura 13.2b) sugiere que, aun cuando puede ser razona¬ 
ble una relación de línea recta, la suposición de que V(Y¡) = a 2 para cada i es de dudosa va¬ 
lidez. Cuando las suposiciones del capítulo 12 son válidas, se puede demostrar que entre 
todos los estimados insesgados de /3 0 y ¡6¡, los estimadores de cuadrados mínimos ordina¬ 
rios tienen varianza mínima. Estos estimadores dan igual valor a cada (x¿, Y¡). Si la varian- 
za de Y aumenta con x, entonces las Y¡ para x¡ grandes deben tener menos valor que aquellas 
con x¡ pequeñas. Esto sugiere que /3 0 y ]3 deben estimarse al minimizar 

UK K) = - (¿0 + V,)] 2 (13.4) 

donde las w¡ son valores que decrecen con x¡ creciente. La reducción al mínimo de la expre¬ 
sión (13.4) da estimaciones de cuadrados mínimos ponderados. Por ejemplo, si la desvia¬ 
ción estándar de Y es proporcional a x (para x > 0), es decir, V( Y) = kx 2 , entonces se puede 
demostrar que los valores w¡ = Mx 2 ¡ dan mejores estimadores de /3 0 y ¡3 ¡. Los libros de John 
Neter y otros y de S. Chatterjee y Bertram Price contienen más detalle (vea la bibliografía 
del capítulo). Los cuadrados mínimos ponderados los emplean con frecuencia expertos en 
econometría (economistas que usan métodos estadísticos) para estimar parámetros. 

Cuando las gráficas u otra evidencia sugieren que el conjunto de datos contiene resul¬ 
tados aislados o puntos que tienen gran influencia en el ajuste resultante, un posible méto¬ 
do es omitir estos puntos aislados y recalcular la ecuación de regresión estimada. Es seguro 
que esto sería correcto si se encontrara que los resultados aislados aparecieron por errores 
al registrar valores de datos o de errores experimentales. Si no se puede hallar una causa pa¬ 
ra los resultados aislados, es deseable informar la ecuación estimada con y sin haber omiti¬ 
do los resultados aislados. Otro método adicional es retener posibles resultados aislados 
pero sólo para usar un principio de estimación que pone relativamente menos peso a valo¬ 
res aislados del que da el principio de cuadrados mínimos. Uno de estos principios es el 
MAD (minimizar desviaciones absolutas), que selecciona /3 0 y ¡3 l para minimizar X | y, — 
( b 0 + b x x¡) |. A diferencia de las estimaciones de cuadrados mínimos, no hay fórmulas exac¬ 
tas para las estimaciones MAD; sus valores deben hallarse con el uso de procedimientos 
computacionales iterativos. Estos procedimientos también se usan cuando se sospecha que 
las e¡ tienen una distribución que no es normal y que, en cambio, tiene “colas pesadas” (lo 
cual hace más probable para la distribución normal que valores discrepantes entren en la 
muestra); los procedimientos de regresión robustos son aquellos que producen estimaciones 
confiables para una amplia variedad de distribuciones de error subyacentes. Los estimado¬ 
res de cuadrados mínimos no son robustos en la misma forma que la media muestral X no 
es un estimador robusto para ¡jl. 

Cuando una gráfica sugiere dependencia del tiempo en los términos de error, un análi¬ 
sis apropiado puede comprender una transformación de las y o un modelo que en forma explí¬ 
cita incluya una variable de tiempo. Por último, una gráfica como la de la figura 13.2f), que 
presenta un patrón en los residuos cuando se traza contra una variable omitida, sugiere que de¬ 
be considerarse un modelo de regresión múltiple que incluya la variable previamente omitida. 


EJERCICIOS Sección 13.1 (1-14) 


1. Suponga que las variables x = distancia de viaje al trabajo y 
y = tiempo de viaje al trabajo están relacionadas de acuerdo 
con el modelo de regresión lineal simple con cr = 10. 

a. Si se hacen n = 5 observaciones en los valores x de 
x¡ = 5, x 2 — 10, x¡ = 15, x 4 = 20 y x 5 = 25, calcule las 
desviaciones estándar de los cinco residuos correspon¬ 
dientes. 

b. Repita el inciso a) para x x = 5, x 2 = 10, jc 3 = 15, x 4 = 
20 y x 5 = 50. 


c. ¿Qué implican los resultados de los incisos a) y b) acer¬ 
ca de la desviación de la línea estimada de la observa¬ 
ción hecha en el valor x máximo muestreado? 

2. Los valores x y residuos estandarizados para los datos de 
flujo de cloro/(velocidad de grabado), del ejercicio 52 (sec¬ 
ción 12.4), se muestran en la tabla siguiente. Construya 
una gráfica de residuos estandarizada y comente sobre su 
aspecto. 
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X 

1.50 

1.50 

2.00 

2.50 

2.50 

e* 

0.31 

1.02 

-1.15 

-1.23 

0.23 

X 

3.00 

3.50 

3.50 

4.00 


e* 

0.73 

-1.36 

1.53 

0.07 



3. El ejemplo 12.6 presentó los residuos de una regresión li¬ 
neal simple de contenido de humedad y sobre la rapidez de 
filtración x. 

a. Trace los residuos en función de x. ¿La gráfica resultan¬ 
te sugiere que una función de regresión de línea recta 
es una opción razonable de modelo? Explique su ra¬ 
zonamiento. 

b. Usando í = 0.665, calcule los valores de los residuos es¬ 
tandarizados. ¿Es e* ~ e¡/s para i = 1, o no 

están las e* cerca de ser proporcionales a las e¡? 

c. Trace los residuos estandarizados en función de x. ¿Di¬ 
fiere esta gráfica significativamente en su aspecto gene¬ 
ral con respecto a la gráfica del inciso a)? 

4. La resistencia al desgaste de ciertos componentes de reac¬ 
tores nucleares hechos de Zircaloy-2 se determina en parte 
por las propiedades de la capa de óxido. La siguiente infor¬ 
mación aparece en un artículo que propuso un nuevo méto¬ 
do de prueba no destructivo para vigilar el grosor de la capa 
(“Monitoring of Oxide Layer Thickness on Zircaloy-2 by 
the Eddy Current Test Method”, J. of Testing and Eval., 
1987: 333-336). Las variables son x = grosor de la capa de 
óxido (¿im) y y = respuesta de la corriente parásita o turbu¬ 
lenta (unidades arbitrarias). 


X 

0 

7 

17 

114 

133 

y 

20.3 

19.8 

19.5 

15.9 

15.1 

X 

142 

190 

218 

237 

285 

y 

14.7 

11.9 

11.5 

8.3 

6.6 


a. Los autores resumieron la relación al dar la ecuación de 
la recta de cuadrados mínimos como y = 20.6 — 0.047x. 
Calcule y trace los residuos en función de x y luego co¬ 
mente sobre lo apropiado del modelo de regresión lineal 
simple. 

b. Use í = 0.7921 para calcular los residuos estandarizados 
de una regresión lineal simple. Construya una gráfica de 
residuos estandarizada y comente. También construya 
una gráfica de probabilidad normal y comente. 

5. Cuando desciende la temperatura del aire, el agua de un río 
se hace muy fría y se forman cristales de hielo. Este hielo 
puede afectar de manera significativa la hidráulica de un 
río. El artículo “Laboratory Study of Anchor Ice Growth” 
( J. of Coid Regions Engr., 2001: 60-66) describió un expe¬ 
rimento en el que el grosor del hielo (mm) se estudió como 
función del tiempo transcurrido (h) bajo condiciones espe¬ 
cificadas. La información siguiente se leyó de una gráfica 
del artículo: n = 33; x = 0.17, 0.33, 0.50, 0.67, . . . , 5.50; 
y = 0.50, 1.25,1.50, 2.75, 3.50, 4.75, 5.75, 5.60, 7.00, 8.00, 

8.25.9.50, 10.50, 11.00, 10.75, 12.50, 12.25, 13.25, 15.50, 
15.00, 15.25, 16.25, 17.25, 18.00, 18.25, 18.15, 20.25, 

19.50, 20.00, 20.50, 20.60, 20.50, 19.80. 


a. El valor r 2 resultante de un ajuste de cuadrados mínimos 
es 0.977. Interprete este valor y comente sobre lo apro¬ 
piado de suponer una relación lineal aproximada. 

b. Los residuos, escritos en el mismo orden que los valores x, 
son: 


-1.03 

-0.92 

-1.35 

-0.78 

-0.68 

-0.11 

0.21 

-0.59 

0.13 

0.45 

0.06 

0.62 

0.94 

0.80 

-0.14 

0.93 

0.04 

0.36 

1.92 

0.78 

0.35 

0.67 

1.02 

1.09 

0.66 

-0.09 

1.33 

-0.10 

-0.24 

-0.43 

-1.01 

-1.75 

-3.14 




Dibuje los residuos contra el tiempo transcurrido. ¿Qué su¬ 
giere la gráfica? 

6. Los datos siguientes sobre x = densidad verdadera (kg/mm 3 ) 
y y = contenido de humedad (% en seco) se leyeron de una 
gráfica en el artículo “Physical Properties of Cumin Seed” 
(J. Agrie. Engr. Res., 1996: 93-98). 


X 

7.0 

9.3 

13.2 

16.3 

19.1 

22.0 

y 

1046 

1065 

1094 

1117 

1130 

1135 


La ecuación de la recta de mínimos cuadrados es y = 
1008.14 + 6.19268V (esto difiere ligeramente de la ecua¬ 
ción dada en el artículo); i = 7.265 y r 2 = 0.968. 

a. Realice una prueba de la utilidad del modelo y comente. 

b. Calcule los valores de los residuos y dibuje los residuos 
en función de x. ¿La gráfica sugiere que una función de 
regresión lineal es inapropiada? 

c. Calcule los valores de los residuos estandarizados y tráce¬ 
los en función de x. ¿Hay algunos residuos estandarizados 
inusualmente grandes (positivos o negativos)? ¿Esta grá¬ 
fica da el mismo mensaje que la del inciso b) con respec¬ 
to a lo apropiado de una función de regresión lineal? 

7. El artículo “Effects of Gamma Radiation on Juvenile and 
Mature Cuttings of Quaking Aspen” (Forest Science, 1967: 
240-245) publica los datos siguientes sobre el tiempo de ex¬ 
posición a la radiación ( x , en kr/(16 h) y peso seco de raíces 
(y, en mg X 10 -1 ). 


X 

0 

2 

4 

6 

8 

y 

110 

123 

119 

86 

62 


a. Construya una gráfica de puntos. ¿La gráfica sugiere 
que es apropiada una relación probabilística lineal? 

b. Una regresión lineal resulta en la recta de mínimos 
cuadrados y = 127 — 6.65x, con í = 16.94. Calcule los 
residuos y residuos estandarizados y luego construya 
gráficas de residuos. ¿Qué sugieren estas gráficas? ¿Qué 
tipo de función debe dar un mejor ajuste a los datos de 
lo que da una recta? 

8. El registro continuo de la pulsación cardiaca se puede usar 
para obtener información acerca del nivel de intensidad de 
ejercicios o esfuerzo físico durante una participación depor¬ 
tiva, trabajo u otras actividades diarias. El artículo ‘‘The Re- 
lationship between Heart Rate and Oxygen Uptake During 
Non-Steady State Exercise” ( Ergonomics , 2000: 1578- 
1592) publicó un estudio para investigar el uso de la respues¬ 
ta del ritmo cardiaco (x, como porcentaje del ritmo máximo) 
para predecir la toma de oxígeno (y, como porcentaje de 
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toma máxima) durante el ejercicio. La información siguien¬ 
te es de una gráfica del artículo. 


HR 

43.5 

44.0 

44.0 

44.5 

44.0 

45.0 

48.0 

49.0 

vo 2 

22.0 

21.0 

22.0 

21.5 

25.5 

24.5 

30.0 

28.0 

HR 

49.5 

51.0 

54.5 

57.5 

57.7 

61.0 

63.0 

72.0 

vo 2 

32.0 

29.0 

38.5 

30.5 

57.0 

40.0 

58.0 

72.0 


Use un paquete computacional de estadística para efectuar 
un análisis de regresión lineal simple, poniendo particular 
atención a la presencia de cualesquiera observaciones poco 
comunes o que influyan. 

9. Considere los siguientes cuatro conjuntos de datos ( x , y); 
los tres primeros tienen los mismos valores de x, de modo 
que estos valores aparecen sólo una vez. (Frank Anscombe, 
“Graphs in Statistical Analysis”, Amer. Statistician, 1973: 
17-21): 


Conjunto 


de datos 

1-3 

1 

2 

3 

4 

4 

Variable 

X 

y 

y 

y 

X 

y 


10.0 

8.04 

9.14 

7.46 

8.0 

6.58 


8.0 

6.95 

8.14 

6.77 

8.0 

5.76 


13.0 

7.58 

8.74 

12.74 

8.0 

7.71 


9.0 

8.81 

8.77 

7.11 

8.0 

8.84 


11.0 

8.33 

9.26 

7.81 

8.0 

8.47 


14.0 

9.96 

8.10 

8.84 

8.0 

7.04 


6.0 

7.24 

6.13 

6.08 

8.0 

5.25 


4.0 

4.26 

3.10 

5.39 

19.0 

12.50 


12.0 

10.84 

9.13 

8.15 

8.0 

5.56 


7.0 

4.82 

7.26 

6.42 

8.0 

7.91 


5.0 

5.68 

4.74 

5.73 

8.0 

6.89 


Para cada uno de estos cuatro conjuntos de datos, los valo¬ 
res de las estadísticas de resumen Y.x¡, Y.x 2 ¡, 2/vy, 2/y? y Hx¡y¡ 
son prácticamente idénticos, de modo que todas las cantida¬ 
des calculadas de estos cinco serán idénticas en esencia 
para los cuatro conjuntos: la recta de cuadrados mínimos 
(y = 3 + 0.05x), SCE, s 2 , r 2 , intervalos f, estadísticas t, etc. 
Las estadísticas de resumen no dan una forma de distinguir 
entre los cuatro conjuntos de datos. Con base en una gráfi¬ 
ca de puntos y una gráfica de residuos para cada conjunto, 
comente sobre lo apropiado o no de ajustar un modelo de lí¬ 
nea recta; incluya en sus comentarios cualesquiera sugeren¬ 
cias específicas sobre cómo es que un “análisis de línea 
recta” podría modificarse o calificarse. 

10. a. Demuestre que 2¡=i e¡ = 0 cuando las e¡ son los resi¬ 
duos de una regresión lineal simple. 

b. Los residuos de una regresión lineal simple, ¿son inde¬ 
pendientes entre sí, están positivamente correlaciona¬ 
dos, o negativamente correlacionados? Explique. 

c. Demuestre que 2" =1 x¡e¡ = 0 para los residuos de una re¬ 
gresión lineal simple. (Este resultado junto con el inciso a) 
muestra que hay dos restricciones lineales en las e¡, re¬ 
sultando en una pérdida de 2 grados de libertad cuando 
se usa el cuadrado de los residuos para estimar cr 2 .) 

d. ¿Es cierto que 2" =1 e* = 0? Dé una prueba o un ejem¬ 
plo contrario. 


11. a. Exprese el /-ésimo residuo Y¡ — Y¡, donde Y¡ = 0 O + 0 x x¡ 

en la forma HcjYj, una función lineal de las Yj. A conti¬ 
nuación use reglas de varianza para verificar que V(Y¡ — Y¡) 
está dada por la expresión (13.2). 

b. Se puede demostrar que Y¡ y Y¡ — Y : (el /-ésimo valor pro¬ 
nosticado y residuo) son independientes entre sí. Use es¬ 
te hecho, la relación Y¡ = Y¡ + (Y t — Y¡), y la expresión 
para V(Y) de la sección 12.4 para otra vez verificar la ex¬ 
presión (13.2). 

c. Cuando x¡ se aleja de x, ¿qué ocurre a V(Y¡) y a V(Y¡ — Y¡)‘~! 

12. a. ¿Podría una regresión lineal tener los residuos 23, —27, 

5, 17, —8, 9 y 15? ¿Por qué sí o por qué no? 
b. ¿Podría una regresión lineal resultar en residuos 23, 
—27, 5, 17, —8, —12 y 2 correspondientes a los valores 
x de 3, —4, 8, 12, —14, —20 y 25? ¿Por qué sí o por qué 
no? [Sugerencia: Vea el ejercicio 10.] 

13. Recuerde que 0 O + 0 x x tiene una distribución normal con 
valor esperado /3 0 + /3 x x y varianza 



{x-xf 1 


de modo que 

0o + 0i x ~ (fio + /V) 

( l \ m 

a \n B*/-*) 2 / 


tiene una distribución normal estándar. Si S =VSCE/(n — 2) 
se sustituye por a, la variable resultante tiene una distribu¬ 
ción t con n — 2 grados de libertad. Por analogía, ¿cuál es 
la distribución de cualquier residuo estandarizado en par¬ 
ticular? Si n = 25, ¿cuál es la probabilidad de que un resi¬ 
duo estandarizado en particular caiga fuera del intervalo 
(-2.50, 2.50)? 


14. Si hay al menos un valor de x en el que más de una obser¬ 
vación se haya hecho, hay un procedimiento formal de 
prueba para probar 

H 0 : iJu Y . x — P 0 + PiX para algunos valores J3 0 , (la función 
de regresión verdadera es lineal) 

en función de 

H 0 no es verdadera (la función de regresión verdadera 
no es lineal) 

Suponga que se hacen observaciones en x¡, x 2 , ■ ■ . , x c . De¬ 
note con i 7 ... Y 12 , .... Y hn las n¡ observaciones cuando x = 
r cl , y c2 , ... , Y cn denota las n c observaciones cuando 
x = x c . Con n = (el número total de observaciones), 
SCE tiene n — 2 grados de libertad. Se descompone SCE en 
dos partes, SCEP (error puro) y SCEA. (falta de ajuste) co¬ 
mo sigue: 

SCEP = XX(E 0 - - Y,) 2 

SCFA = SCE - SCEP 


Las n¡ observaciones en x¡ contribuyen con n¡ — 1 grados 
de libertad a SCEP, de modo que el número de grados de li¬ 
bertad para SCEP es Y.¡{n¡ — 1) = n — c y los grados de 
libertad para SCFA es n — 2 — (n — c) = c — 2. Sea 
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MCEP = SCEP/(n - c) y MCFA = SCFA/(c - 2). Enton¬ 
ces se puede demostrar que mientras £(MCEP) = a 2 ya sea 
que H 0 sea o no verdadera, F(MCFA) = cr 2 si H 0 es verda¬ 
dera y £(MCFA) > a 2 si H 0 es falsa. 

MCFA 

Estadística de prueba: F — - 

F MCEP 

Región de rechazo:/> F ac _ 2¡n . c 

Los datos siguientes provienen del artículo “Changes in 
Growth Hormona Status Related to Body Weight of Gro- 
wing Cattle” ( Growth , 1977: 241-247), con x — peso corpo¬ 
ral y y = rapidez de eliminación metabólica/peso corporal. 


X 

110 

110 

110 

230 

230 

230 

360 

y 

235 

198 

173 

174 

149 

124 

115 


x 360 360 360 505 505 505 505 

y 130 102 95 122 112 98 96 

(Así, c — 4, n¡ = n 2 = 3, n 3 = n 4 = 4.) 

a. Pruebe H 0 contra al nivel 0.05 usando la prueba de 
falta de ajuste que se acaba de describir. 

b. Una gráfica de puntos de los datos, ¿sugiere que la rela¬ 
ción entre x y y es lineal? ¿Cómo se compara esto con el 
resultado del inciso a)? (Una función de regresión no li¬ 
neal se utilizó en el artículo.) 


13.2 Regresión con variables transformadas 



La necesidad de un modelo alternativo para el modelo probabilístico lineal Y = /3 0 + ¡3 lx + e 
puede ser sugerida ya sea por un argumento teórico o al examinar gráficas de diagnóstico 
desde un análisis de regresión lineal. En cualquiera de estos casos, es deseable escoger un 
modelo cuyos parámetros se puedan estimar con facilidad. Una clase importante de estos mo¬ 
delos se especifica por medio de funciones que sean “intrínsecamente lineales” 


DEFINICIÓN 


Una función que relacione y con x es intrínsecamente lineal si por medio de una 
transformación de x y/o y, la función se puede expresar como y' = ¡ 3 0 + f3¡x', donde 
x’ = la variable independiente transformada y y' = la variable dependiente trans¬ 
formada. 



En la tabla 13.1 se dan cuatro de las funciones intrínsecamente lineales más útiles. En cada 
caso, la transformación apropiada es o bien una transformación logarítmica, ya sea de loga¬ 
ritmos de base 10 o naturales (base e), o una transformación recíproca. Unas gráficas repre¬ 
sentativas de las cuatro funciones aparecen en la figura 13.3. 


Tabla 13.1 Funciones intrínsecamente lineales útiles* 


Función 

Transformación(es) para linealizar 

Forma lineal 

a. Exponencial: y = ae ilx 

y' = ln(v) 

y' = ln(a) + f3x 

b. Potencia: y = ax& 

y' = log(y), x' = logU) 

y' = log(a:) + fix' 

c. y = a + j8 • log(x) 

x' = log(x) 

y = a + fix' 

d. Recíproca: y = a + ¡i • — 

x' =- 

y = a + fix' 


X 



*Cuando aparece log(*), se pueden usar logaritmos de base 10 o de base e. 


Para una relación de función exponencial, sólo y se transforma para alcanzar lineali- 
dad, mientras que, para una relación de función de potencia, tanto x como y se transforman. 
Debido a que la variable x está en el exponente de una relación exponencial, y crece (si 
/3 > 0) o decrece (si /3 < 0) en forma mucho más rápida cuando x aumenta más de lo que 
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y 

/3 > o 


y 

fí > o 

o - 


0 - 

DEFINICIÓN 
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.v y .v 



Figura 13.3 Gráficas de las funciones intrínsecamente lineales dadas en la tabla 13.1. 


es el caso para la función de potencia, aun cuando en un breve intervalo de valores de x pue¬ 
de ser difícil distinguir entre las dos funciones. Ejemplos de funciones que no son intrínse¬ 
camente lineales son y = a + ye íix y y = a + yrd 3 . 

Las funciones intrínsecamente lineales llevan de manera directa a modelos probabi- 
lísticos que, aun cuando no son lineales en x como función, tienen parámetros cuyos valo¬ 
res se estiman con facilidad usando mínimos cuadrados ordinarios. 


O 


Un modelo probabilístico que relaciona faxes intrínsecamente lineal si, por me¬ 
dio de una transformación en Y y/o x, se puede reducir a un modelo probabilístico li¬ 
neal Y' = 1 3 0 + /3,-v' 4- e'. 


Los modelos probabilísticos intrínsecamente lineales que corresponden a las cuatro funcio¬ 
nes de la tabla 13.1 son los siguientes: 

a. Y = aé ix • e, un modelo multiplicativo exponencial, de modo que ln(K) = Y' = j8 0 + 
/3[X' + e' con x' = x, (3 0 = ln(a), (3¡ = ¡3 y e' = ln(e). 

b. Y = o'A'f* • e, un modelo multiplicativo de potencia, de modo que logf Y) = Y' = j8 0 + 
/3jx' + e' con x' = log(x), /3 0 = log(a), = )3 y e' = log(e). 

c. Y = a + j8 log(x) + e, de modo que x' = log(x) linealiza de inmediato el modelo. 

d. Y = a + ¡3 • l/x + e, de modo que x' = Mx da un modelo lineal. 

Los modelos aditivos exponencial y de potencia, Y = ae^ x + e y Y = ax fi + e, no son in¬ 
trínsecamente lineales. Nótese que a) y b) requieren una transformación en Y y, como resul¬ 
tado, una transformación en la variable de error e. De hecho, si e tiene una distribución 
lognormal (véase capítulo 4) con E(e) = e" ín y V(e) = t 2 independientes de x, entonces los 
modelos transformados para a) y b) van a satisfacer todas las suposiciones del capítulo 12 
con respecto al modelo probabilístico lineal; esto a su vez implica que todas las inferencias 
para los parámetros del modelo transformado con base en estas suposiciones será válido. Si 
a 2 es pequeña, q K . v ~ ae lix en a) y ax^ en b). 
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La ventaja principal de un modelo intrínsecamente lineal es que los parámetros j8 0 y 
¡3 l del modelo transformado se pueden estimar de inmediato, con el uso del principio de 
mínimos cuadrados, con sólo sustituir x' y y' en las fórmulas estimadoras: 


ñ = Z,x!y¡ ~ 'Zx'j'Zy'j/n 

Pl 5>,') 2 - dx’f/n 


(13.5) 


Po 




n 

Los parámetros del modelo original no lineal se pueden estimar entonces al transformar de 
nuevo j8 0 y/o [3 l si es necesario. Una vez calculado el intervalo de predicción para y' cuan¬ 
do x' = x'*, la inversión de la transformación da un intervalo de predicción (IP) para y 
misma. En los casos a) y b), cuando a 2 es pequeña, un intervalo de confianza (IC) para ¡jl y . x * 
resulta de tomar los antilogaritmos de los límites del IC por /3 0 4- fí¡x'* (estrictamente ha¬ 
blando, tomar antilogaritmos da un IC por la mediana de la distribución Y, es decir, por 
jX Y -x *. Debido a que la distribución lognormal está sesgada de manera positiva, /j, > ¡1\ las 
dos son aproximadamente iguales si a 2 es cercana a 0.) 


Ejemplo 13.3 La ecuación de Taylor para la duración y de herramientas como función del tiempo de cor¬ 
te .y indica que xy c = k o bien, lo que es equivalente, que y = ax^. El artículo “The Effect 
of Experimental Error on the Determination of Optimum Metal Cutting Conditions” 
(J. Eng. for Industry, 1967: 315-322) observa que la relación no es exacta (determinista) y 
que los parámetros a y ¡3 deben ser estimados a partir de los datos. Así, un modelo apropia¬ 
do es el modelo multiplicativo de potencia Y = a • x& • e, que el autor ajustó a los datos que 
aparecen a continuación y que constan de las observaciones de la duración de 12 herramien¬ 
tas de carburo (tabla 13.2). Además de los valores x, y, x' y y', se dan los valores transfor¬ 
mados pronosticados (y') y los valores pronosticados en la escala original (y, después de 
transformar de nuevo). 


Tabla 13.2 Datos para el ejemplo 13.3 



X 

y 

x' = ln(x) 

y' = ln(y) 

r 

II 

1 

600. 

2.3500 

6.39693 

0.85442 

1.12754 

3.0881 

2 

600. 

2.6500 

6.39693 

0.97456 

1.12754 

3.0881 

3 

600. 

3.0000 

6.39693 

1.09861 

1.12754 

3.0881 

4 

600. 

3.6000 

6.39693 

1.28093 

1.12754 

3.0881 

5 

500. 

6.4000 

6.21461 

1.85630 

2.11203 

8.2650 

6 

500. 

7.8000 

6.21461 

2.05412 

2.11203 

8.2650 

7 

500. 

9.8000 

6.21461 

2.28238 

2.11203 

8.2650 

8 

500. 

16.5000 

6.21461 

2.80336 

2.11203 

8.2650 

9 

400. 

21.5000 

5.99146 

3.06805 

3.31694 

27.5760 

10 

400. 

24.5000 

5.99146 

3.19867 

3.31694 

27.5760 

11 

400. 

26.0000 

5.99146 

3.25810 

3.31694 

27.5760 

12 

400. 

33.0000 

5.99146 

3.49651 

3.31694 

27.5760 


Las estadísticas de resumen para ajustar una línea recta a los datos transformados son E*í = 
74.41200, Ev' = 26.22601, Exp = 461.75874, Ev,' 2 = 67.74609 y E-v'y,' = 160.84601, de 
modo que 

- _ (160.84601) - (74.41200)(26.22601)/12 
^ ~ 461.75874 - (74.41200) 2 /l2 “ ~ 53996 

26.22601 - (-5.3996X74.41200) 

/3 0 = -“--- ¿ = 35.6684 


Los valores estimados para a y /?, los parámetros del modelo de función de potencia, son 
/3 = /3[ = -5.3996 y a = e&° = 3.094491530 • 10 15 . Entonces, la función de regresión 
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Ejemplo 13.4 
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estimada es jl Y . x ~ 3.094491530 • 10 15 • x~ 53996 . Para recapturar la ecuación de Taylor (es¬ 
timada), se establece y = 3.094491530 • 10 15 • y -53996 , de donde xv 0185 = 740. 

La figura 13.4a) da una gráfica de los residuos estandarizados de la regresión lineal 
usando variables transformadas (para las que r 2 = 0.922); no hay patrón aparente en la grá¬ 
fica, aun cuando un residuo estandarizado es un poco grande, y los residuos se ven como 
deben para una regresión lineal simple. La figura 13.4b) presenta una gráfica de y en fun¬ 
ción de y, que indica predicciones satisfactorias sobre la escala original. 

Para obtener un intervalo de confianza para la duración mediana de la herramientas 
cuando el tiempo de corte es 500, se transforma x = 500 a x' = 6.21461. Entonces j8 0 + 
= 2.1120 y un intervalo de confianza de 95% para J3 () + /?,(6.21461) es (de la sección 
12.4) 2.1120 ± (2.228X0.0824) = (1.928, 2.296). El intervalo de confianza de 95% para 
/j,y. 500 se obtiene entonces al tomar los antilogaritmos: (e L928 , e 2 - 296 ) = (6.876, 9.930). Se pue¬ 
de verificar con facilidad que para los datos transformados s 2 = a 2 ~ 0.081. Debido a que 
esto es muy pequeño, (6.876,9.930) es un intervalo aproximado para /u, y . 500 . 


e* y 



Figura 13.4 a) Residuos estandarizados en función de x' del ejemplo 13.3; b)y en función de y del 
ejemplo 13.3 ■ 


En el artículo “Ethylene Synthesis in Lettuce Seeds: Its Physiological Significance” (Plant 
Physiology, 1972: 719-722), el contenido de etileno en semillas de lechuga (y, en nl/g pe¬ 
so en seco) se estudió como función de la exposición de tiempo (x, en min) a un absorben¬ 
te de etileno. La figura 13.5 presenta una gráfica de puntos de los datos y una gráfica de los 



3.0 

2.0 

1.0 

0.0 

- 1.0 

- 2.0 


l_I_I 


0.0 20 40 60 80 100 

b) 


Figura 13.5 a) Gráfica de puntos; b) gráfica de residuos de regresión lineal para los datos del 
ejemplo 13.4. 
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residuos generados de una regresión lineal de y en x. Ambas gráficas muestran un fuerte pa¬ 
trón curvado, que sugiere que es apropiada una transformación para alcanzar linealidad. 
Además, una regresión lineal da predicciones negativas para x = 90 y x = 100. 

El autor no dio ningún argumento para un modelo teórico, pero esta gráfica de y' = 
ln(v) en función de x muestra una fuerte relación lineal, que sugiere que una función expo¬ 
nencial dará un buen ajuste a los datos. La tabla 13.3 muestra los valores de datos y otra in¬ 
formación de una regresión lineal de y' en x. Las estimaciones de parámetros del modelo 


Tabla 13.3 Datos para el ejemplo 13.4 


X 

J 

y' = ln(y) 

y' 

II 

2 

408 

6.01 

5.876 

353.32 

10 

274 

5.61 

5.617 

275.12 

20 

196 

5.28 

5.294 

199.12 

30 

137 

4.92 

4.971 

144.18 

40 

90 

4.50 

4.647 

104.31 

50 

78 

4.36 

4.324 

75.50 

60 

51 

3.93 

4.001 

54.64 

70 

40 

3.69 

3.677 

39.55 

80 

30 

3.40 

3.354 

28.62 

90 

22 

3.09 

3.031 

20.72 

100 

15 

2.71 

2.708 

15.00 



lineal son j8¡ = -0.0323 y /3 0 = 5.941, con r 1 = 0.995. La función de regresión estimada 
para el modelo exponencial es pb Y . x ~ e íi¡ • e líx = 380.32c °- 0323x . Los valores pronostica¬ 
dos y¡ se pueden obtener entonces por sustitución de x¡ (i = 1,. . ., n) en fi Y . x o bien al calcu¬ 
lar = e 1 . donde las y'¡ son las predicciones del modelo transformado de línea recta. La 
figura 13.6 presenta tanto una gráfica de e'* en función de x (los residuos estandarizados 
de una regresión lineal) y una gráfica de y en función de y. Estas gráficas apoyan la elección de 
un modelo exponencial. 



2.0 

1.0 - 

0.0 - - 

- 1.0 - 

- 2.0 


0.0 20 40 60 80 

a) 


100 



Figura 13.6 Gráfica de a) residuos estandarizados (después de transformar) en función de x, b) y en 
función de y para datos del ejemplo 13.4 ■ 


Al analizar datos transformados, se deben recordar los puntos siguientes: 


1. Estimar /3 l y /8 0 como en (13.5) y luego transformar de nuevo, para obtener estimaciones 
de los parámetros originales, no es equivalente a usar el principio de mínimos cuadrados 
directamente en el modelo original. Así, para el modelo exponencial, se podría estimar 
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a y al minimizar 2Xy¡- — Sería necesario un cálculo iterativo. Las estimaciones 

resultantes no serían iguales a a ¥= e^° y /3 ¥= /3 X . 

2. Si el modelo seleccionado no es intrínsecamente lineal, el método resumido en (13.5) 
no se puede usar. En lugar de esto, tendrían que aplicarse mínimos cuadrados (o algún 
otro procedimiento ajustado) al modelo no transformado. Por tanto, para el modelo 
exponencial aditivo Y = ae íix + e, los cuadrados mínimos comprenderían minimizar 
K» — ae^ X: ) 2 . Tomando derivadas parciales con respecto a a y fi resulta en dos ecuacio¬ 
nes normales no lineales enay/3; estas ecuaciones deben resolverse entonces usando un 
procedimiento iterativo. 

3. Cuando el modelo lineal transformado satisface todas las suposiciones mencionadas en 
el capítulo 12, el método de mínimos cuadrados da las mejores estimaciones de los pa¬ 
rámetros transformados. No obstante, las estimaciones de los parámetros originales pue¬ 
den no ser los mejores en ningún sentido, aun cuando sean razonables. Por ejemplo, en 
el modelo exponencial, el estimador a = é ih no será insesgado, aun cuando será el esti¬ 
mador de a de máxima verosimilitud si el error variable e' está normalmente distribuido. 
Usando mínimos cuadrados de manera directa (sin transformar) podría dar mejores esti¬ 
maciones, aun cuando los cálculos serían bastante tediosos. 

4. Si se ha hecho una transformación en y y se desea usar las fórmulas estándar para pro¬ 
bar hipótesis o construir intervalos de confianza (IC), e' debe estar distribuida al menos 
aproximadamente en forma normal. Para verificar esto, deben comprobarse los residuos de 
la regresión transformada. 

5. Cuando y es transformada, el valor r 2 de la regresión resultante se refiere a una variación 

en las y. explicada por el modelo de regresión transformado. Aun cuando un alto valor 
de r 2 aquí indica un buen ajuste del modelo no lineal original estimado para las y¡ obser¬ 
vadas, r 2 no se refiere a las observaciones originales. Quizá la mejor forma de evaluar la 
calidad del ajuste es calcular los valores pronosticados y¡, usando el modelo transforma¬ 
do, convirtiéndolos de nuevo a la escala y original para obtener y¡, y luego trazar y en 
función de y. Un buen ajuste se hace entonces evidente por puntos cercanos a la recta de 
45°. Se podría calcular SCE = ~ y,) 2 como una medida numérica de la bondad 

de ajuste. Cuando el modelo era lineal, se compara esto con STC = 5Xy¡ — y) 2 , la varia¬ 
ción total alrededor de la recta horizontal a una altura y, lo cual llevó a r 2 . En el caso no 
lineal, sin embargo, no es necesariamente informativo medir la variación total en esta for¬ 
ma, de modo que un valor r 2 no es tan útil como en el caso lineal. 

Métodos más generales de regresión 

Hasta este punto se ha supuesto que Y = f(x) + e (un modelo aditivo) o que Y = f(x) • e (un 
modelo multiplicativo). En el caso del modelo aditivo, ¡l y . x = f(x), de modo que estimar la 
función de regresión/(x) equivale a estimar la curva de valores medios de y. En ocasiones, 
una gráfica de puntos de los datos sugiere que no hay una expresión matemática sencilla pa¬ 
ra/(x). Los expertos en estadística han creado recientemente algunos métodos más flexibles 
que permiten modelar una amplia variedad de patrones usando el mismo procedimiento 
apropiado. Uno de estos métodos es el LOWESS (o LOESS), que es una abreviatura de lo- 
cally weighted scatter plot smoother (suavizador de gráficas de puntos localmente pondera¬ 
do). Denote con (x*, y*) uno de los n pares particulares (x, y) de la muestra. El valor y 
correspondiente a (x*, y*) se obtiene al ajustar una recta usando sólo un porcentaje especi¬ 
ficado de los datos (por ejemplo 25%) cuyos valores x son más cercanos a x*. Además, en 
lugar de usar mínimos cuadrados “ordinarios”, que da un valor igual a todos los puntos, los 
que tienen valores x más cercanos a x* tienen más valor que los valores x que están más ale¬ 
jados. La altura de la recta resultante arriba de x* es el valor ajustado y*. Este proceso se re¬ 
pite para cada uno de los n puntos, de modo que n líneas diferentes se ajustan (es seguro que 
el lector no desearía hacer esto manualmente). Por último, los puntos ajustados se enlazan 
para obtener una curva LOWESS. 
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Ejemplo 13.5 Por lo general, no es factible pesar grandes animales muertos y encontrados en zonas silves¬ 
tres, de modo que es mejor tener un método para estimar el peso a partir de diversas carac¬ 
terísticas de un animal que se puedan determinar con facilidad. MINITAB tiene un conjunto 
de datos en memoria que consisten en diversas características para una muestra de n = 143 
osos salvajes. La figura 13.7a) muestra una gráfica de puntos de y = peso en función de 
x = distancia alrededor del pecho (circunferencia del pecho). A primera vista, parece como 
si una sola línea obtenida de cuadrados mínimos ordinarios resumiría de manera eficaz el 
patrón. La figura 13.7b) muestra que la curva LOWESS producida por MINITAB, usando 
un espacio de 50% [el ajuste en (x*, y*), está determinada por el 50% más cercano de la 
muestra]. La curva parece estar formada por dos segmentos de recta unidos arriba de apro¬ 
ximadamente x = 38. La línea más inclinada a la derecha de 38, que indica el peso, tiende 
a aumentar con más rapidez como lo hace la circunferencia para círculos mayores a 38 pulgadas. 






Figura 13.7 Gráfica de puntos de MINITAB y curva LOWESS para datos del peso de osos. 
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Es complicado hacer otras inferencias (por ejemplo, obtener un intervalo de confian¬ 
za para un valor y medio) con base en este tipo general de modelo de regresión. La técnica 
de instrucciones preliminares mencionada antes se puede usar para este fin. 


Regresión logística 

El modelo sencillo de regresión lineal es apropiado para relacionar una variable cuantitativa 
de respuesta y a una pronosticadora cuantitativa x. Suponga que y es una variable dicotómi- 
ca con valores posibles 1 y 0 correspondientes a éxito y fracaso. Sea p = P(S) = P(y = 1). 
Con frecuencia, el valor de p dependerá del valor de alguna variable cuantitativa x. Por 
ejemplo, la probabilidad de que un auto necesita servicio de cierta clase dentro de la garan¬ 
tía bien podría depender de la distancia total recorrida por el vehículo, o la probabilidad de 
evitar una infección de cierto tipo podría depender de la dosis en una vacuna. En lugar de usar 
sólo el símbolo p para la probabilidad de éxito, ahora se usa p(x) para resaltar la dependencia 
de esta probabilidad del valor de x. La ecuación de regresión lineal simple Y = ¡i () 4- /3¡x + e 
ya no es apropiada, porque tomar el valor medio de cada lado de la ecuación da 


Py-x = 1 • PM + 0 • (1 - p(x)) = p(x) = /3„ + 

Mientras que p(x) es una probabilidad y por tanto debe estar entre 0 y L /3 0 + fi¡x no ne¬ 
cesitan estar en este rango. 

En lugar de hacer que el valor medio de y sea una función lineal de x, ahora se consi¬ 
dera un modelo en el que alguna función del valor medio de y es una función lineal de x. En 
otras palabras, se hace que p{x) sea una función de j8 0 + (3 t x en lugar de /3 0 + [i¡x misma. 
Una función que se ha encontrado muy útil en numerosas aplicaciones es la función logit 
(de unidad logarítmica) 


p(x) 


e Po+piX 
1 -|_ e Po+P¡x 


La figura 13.8 muestra una gráfica de p(x) para valores particulares de /3 0 y (i¡ con (i¡ > 0. 
Cuando x aumenta, la probabilidad de éxito se incrementa. Para /3¡ negativa, la probabilidad 
de éxito sería una función decreciente de x. 


P(.x) 



Figura 13.8 Gráfica de una función logit. 



Regresión logística significa suponer que p(x) está relacionada a x por la función lo¬ 
git. Álgebra sencilla muestra que 

P {X) — = P Po+PlX 


1 - p(x) 
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La expresión del lado izquierdo recibe el nombre de razón de ventaja. Si, por ejemplo, 

p{ 60) 

-= 3, entonces cuando x = 60 un éxito tiene tres veces más probabilidad que un 

1 - p{ 60) 

fracaso. Ahora se ve que el logaritmo de la probabilidad es una función lineal de la pronos- 
ticadora. En particular, el parámetro de pendiente ¡3 l es el cambio en las probabilidades lo¬ 
garítmicas asociadas con un aumento de 1 unidad en x. Esto implica que la probabilidad en 
sí cambia por el factor multiplicativo e !il cuando x aumenta en 1 unidad. 

El ajuste de la regresión logística a los datos muéstrales requiere que se estimen los 
parámetros J3 0 y /3 j. Por lo general esto se hace usando la técnica de máxima verosimilitud 
descrita en el capítulo 6. Los detalles son muy complicados, pero por fortuna los paquetes de 
computación de estadística más populares harán esto previa solicitud y dan indicaciones 
cuantitativas y gráficas de qué tan bien ajusta el modelo. 

Ejemplo 13.6 A continuación se presentan los datos sobre temperatura en lanzamientos, y la incidencia de 
falla de sellos anulares en 24 lanzamientos antes del desastre del Challenger de enero de 1986. 


Temperatura 

Falla 

Temperatura 

Falla 

Temperatura 

Falla 

53 

Sí 

68 

No 

75 

No 

56 

Sí 

69 

No 

75 

Sí 

57 

Sí 

70 

No 

76 

No 

63 

No 

70 

Sí 

76 

No 

66 

No 

70 

Sí 

78 

No 

67 

No 

70 

Sí 

79 

No 

67 

No 

72 

No 

80 

No 

67 

No 

73 

No 

81 

No 


La figura 13.9 muestra una salida JMP para un análisis de regresión logística. Se ha selec¬ 
cionado denotar con p la probabilidad de falla. Hubo la tendencia de que ocurrieran fallas a 
temperaturas más bajas y éxitos a temperaturas más altas, de modo que la gráfica de p 




50 55 60 65 70 75 80 85 


temp 


(Parameter Estimates 


Term 

Estimate 

Std Error 

ChiSquare 

Prob>ChiSq 

Intercept 

10.8753321 

5,7031291 

3.64 

0.0565 

temp 

-0.1713202 

0.0834419 

4.22 

0.0401 


v_y 


Figura 13.9 Salida de regresión logística de JMP. 
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decrece cuando la temperatura aumenta. La estimación de ¡3 l es j8, = -0.1713, y la desvia¬ 
ción estándar estimada de /3¡ es s^ i = 0.08344. Siempre que n sea suficientemente grande, y 
se supone que éste es el caso, /3¡ tiene aproximadamente una distribución normal. Si /3¡ = 0 
(la temperatura no afecta la probabilidad de falla de sello anular), z = tiene casi una 

distribución normal estándar. El valor de esta razón z es —2.05, y el valor P para una prue¬ 
ba de dos colas es 0.0404 (el doble del área capturada bajo la curva z a la izquierda de 
—2.05). JMP publica el valor de una estadística de prueba ji cuadrada, que es z 2 , y el valor 
P de ji cuadrada difiere del de z sólo por el redondeo. Por cada 1 grado de aumento en tem¬ 
peratura, la probabilidad de falla disminuye en un factor de casi 0.84. La temperatura en 
el lanzamiento para la misión Challenger era de sólo 31°F. Como este valor es mucho me¬ 
nor que cualquier temperatura de la muestra, es riesgoso extrapolar la relación estimada. 
Con todo, parece que para una temperatura así de baja, la falla de anillos anulares es casi 
segura. ■ 


EJERCICIOS Sección 13.2 (15-25) 


15. A nadie que le gusten las tortillas le gustan los pedacitos de 
tortilla pastosos, de modo que es importante hallar caracte¬ 
rísticas del proceso de producción que produzcan pedacitos 
de tortilla con una textura atractiva. Los siguientes datos so¬ 
bre x = tiempo de freír (segundos) y y = contenido de hu¬ 
medad (%) aparecieron en el artículo “Thermal and Physical 
Properties of Tortilla Chips as a Function of Frying Time” 
(J. of Food Processing and Preservation, 1995: 175-189). 


X 

5 

10 

15 

20 

25 

30 

45 

60 

y 

16.3 

9.7 

8.1 

4.2 

3.4 

2.9 

1.9 

1.3 


a. Construya una gráfica de puntos de y en función de x y 
comente. 

b. Construya una gráfica de puntos de los pares (ln(x), 
ln(y)) y comente. 

c. ¿Qué relación probabilística entre x y y sugiere la figura 
lineal de la gráfica del inciso b)? 

d. Pronostique el valor del contenido de humedad cuando 
el tiempo de freír es 20, en una forma que lleve informa¬ 
ción acerca de la confiabilidad y precisión. 

e. Analice los residuos de ajustar el modelo de regresión li¬ 
neal simple a los datos transformados y comente. 

16. Las cuerdas de fibra de poliéster se usan cada vez más co¬ 
mo componentes de líneas de amarre para estructuras de 
mar adentro en aguas profundas. Los autores del artículo 
“Quantifying the Residual Creep Life of Polyester Mooring 
Ropes” ( Intl. J. of Ojfshore and Polar Exploration, 2005: 
223-228) utilizaron los datos siguientes como base para es¬ 
tudiar la forma en que el tiempo para falla (h) dependía de 
la carga (% de carga de ruptura): 


Carga: 

77.7 

77.8 

77.9 

77.8 

85.5 

85.5 

Tiempo: 

5.067 

552.056 

127.809 

7.611 

0.124 

0.077 

Carga: 

89.2 

89.3 

73.1 

85.5 

89.2 

85.5 

Tiempo: 

0.008 

0.013 

49.439 

0.503 

0.362 

9.930 

Carga: 

89.2 

85.5 

89.2 

82.3 

82.0 

82.3 

Tiempo: 

0.677 

5.322 

0.289 

53.079 

7.625 

155.299 


Se ajustó una regresión lineal de log(tiempo) en función de 
la carga. Los investigadores estuvieron particularmente in¬ 
teresados en estimar la pendiente de la recta de regresión 
verdadera al relacionar estas variables. Investigue la calidad 
del ajuste, estime la pendiente, y pronostique el tiempo pa¬ 
ra falla cuando la carga es 80 en una forma que lleve infor¬ 
mación acerca de la confiabilidad y precisión. 

17. Los datos siguientes sobre rapidez de combustión de la masa 
x y longitud de flama y es representativa de los que aparecie¬ 
ron en el artículo “Some Burning Characteristics of Filter Pa¬ 
per” ( Combustión Science and Technology, 1971: 103-120): 


X 

1.7 

2.2 

2.3 

2.6 

2.7 

3.0 

3.2 

y 

1.3 

1.8 

1.6 

2.0 

2.1 

2.2 

3.0 


X 

3.3 

4.1 

4.3 

4.6 

5.7 

6.1 

y 

2.6 

4.1 

3.7 

5.0 

5.8 

5.3 


a. Estime los parámetros de un modelo de función de po¬ 
tencia. 

b. Construya gráficas de diagnóstico para verificar si una 
función de potencia es una opción apropiada de modelo. 

c. Pruebe H 0 : ¡í = | contra H a : ¡3 <í usando una prueba 
de nivel 0.05. 

d. Pruebe la hipótesis nula que expresa que la longitud me¬ 
dia de la flama, cuando la rapidez de combustión es 5.0, 
es el doble que la longitud media de flama cuando la ra¬ 
pidez de combustión es 2.5, contra la alternativa de que 
éste no es el caso. 

18. Las fallas de turbinas de gas de aviones debidas a un alto ci¬ 
clo de fatiga es un problema muy extendido. El artículo 
“Effect of Crystal Orientation on Fatigue Failure of Single 
Crystal Nickel Base Turbine Blade Superalloys (/ ofEngi- 
neering for Gas Turbines and Power, 2002: 161-176) dio 
los datos siguientes y ajuste de un modelo de regresión no 
lineal para pronosticar la amplitud de deformación de ciclos 
hasta que ocurra una falla. Ajuste un modelo apropiado, in¬ 
vestigue la calidad del ajuste, y pronostique la amplitud de 
los ciclos hasta que ocurra una falla y sean = 5000. 
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0 - 


X 

240 

410 

460 

490 

520 

590 

745 

8300 

y 

12.0 

14.7 

14.7 

15.2 

15.2 

15.6 

16.0 

18.1 


a. Estime los parámetros de la función de regresión y la 
función de regresión en sí. 

b. Pronostique el valor de conductividad térmica cuando el 
grosor laminar sea de 500 A. 

22. En cada uno de los casos siguientes, decida si la función da¬ 


Obs 

Ciclos 

p/falla 

Amplit. 
de deform. 

Obs 

Ciclos Amplit. 
p/falla de deform. 

1 

1326 

0.01495 

11 

7356 

0.00576 

2 

1593 

0.01470 

12 

7904 

0.00580 

3 

4414 

0.01100 

13 

79 

0.01212 

4 

5673 

0.01190 

14 

4175 

0.00782 

5 

29516 

0.00873 

15 

34676 

0.00596 

6 

26 

0.01819 

16 

114789 

0.00600 

7 

843 

0.00810 

17 

2672 

0.00880 

8 

1016 

0.00801 

18 

7532 

0.00883 

9 

3410 

0.00600 

19 

30220 

0.00676 

10 

7101 

0.00575 





19. Se realizaron pruebas de resistencia térmica para estudiar la 
relación entre temperatura y duración de alambre esmalta¬ 
do de poliéster (“Thermal Endurance of Polyester Ename- 
led Wires Using Twisted Wire Specimens”, IEEE Trcms. 
Insulation, 1965: 38-44), que dieron por resultado los datos 
siguientes. 


Temp. 

200 

200 

200 

200 

200 

200 

Duración 

5933 

5404 

4947 

4963 

3358 

3878 

Temp. 

220 

220 

220 

220 

220 

220 

Duración 

1561 

1494 

747 

768 

609 

777 

Temp. 

240 

240 

240 

240 

240 

240 

Duración 

258 

299 

209 

144 

180 

184 


a. Una gráfica de puntos de los datos ¿sugiere una relación 
probabilística lineal entre duración y temperatura? 

b. ¿Qué modelo está implicado por una relación lineal en¬ 
tre ln(duración) esperada y 1/temperatura? ¿Aparece 
una gráfica de puntos de los datos transformados consis¬ 
tente con esta relación? 

c. Estime los parámetros del modelo sugerido en el inci¬ 
so b). ¿Qué duración se pronosticaría para una tempera¬ 
tura de 220? 

d. Debido a que hay múltiples observaciones en cada valor*, 
el método del ejercicio 14 se puede usar para probar la 
hipótesis nula que expresa que el modelo sugerido en el 
inciso b) es correcto. Realice la prueba al nivel 0.01. 

20. El ejercicio 14 presentó datos sobre el peso corporal x y la ra¬ 
pidez de eliminación metabólica/peso corporal v. Considere 
las siguientes funciones intrínsecamente lineales para especi¬ 
ficar la relación entre las dos variables: a) ln(y) en función de 
x, b) ln(y) en función de ln(x), c) y en función de ln(x), d) y 
en función de 1/x, y e) ln(y) en función de 1/x. Use cuales¬ 
quiera gráficas de diagnóstico apropiados y análisis para de¬ 
cidir cuáles de estas funciones seleccionaría para especificar 
un modelo probabilístico. Explique su razonamiento. 

Una gráfica del artículo “Thermal Conductivity of Pol- 
yethylene: The Effects of Crystal Size, Density, and Orien- 
tation on the Thermal Conductivity” (Polymer Eng. and 
Science, 1972: 204-208) sugiere que el valor esperado de 
conductividad térmica y es una función lineal de 10 4 • 1/x, 
donde x es el grosor laminar. 


da es intrínsecamente lineal. Si es así, identifique x' y y', y 
luego explique la forma en que un término de error aleato¬ 
rio e se puede introducir para dar un modelo probabilístico 
intrínsecamente lineal. 

a. y = l/(a: + ¡3x) 

b. y = 1/(1 + e a+ P x ) 

c. y = e e (una curva Gompertz) 

d. y = a + fie ÁX 

23. Suponga que x y y están relacionadas de acuerdo con un 
modelo exponencial probabilístico Y = ae^ x • e, con V(e) 
una constante independiente de x (como fue el caso en el 
modelo lineal sencillo Y = /3 0 + /3¡x + e). ¿Es V(Y) una 
constante independiente de x [como fue el caso para Y = 
¡3 0 + jSjX + €, donde V{Y) = cr 2 ]? Explique su razonamien¬ 
to. Trace una figura de una gráfica de puntos prototipo que 
resulte de este modelo. Conteste las mismas preguntas para 
el modelo de potencia Y = ax& • e. 

24. La cifosis es una grave flexión hacia adelante de la espina 
dorsal que se presenta después de una cirugía espinal co¬ 
rrectiva. Un estudio realizado para determinar factores de 
riesgo por la cifosis informó de las edades siguientes (me¬ 
ses) de 40 personas en el momento de la operación; las pri¬ 
meras 18 personas tenían cifosis, no así las 22 restantes. 


Con cifosis 

12 

15 

42 

52 

59 

73 


82 

91 

96 

105 

114 

120 


121 

128 

130 

139 

139 

157 

Sin cifosis 

1 

1 

2 

8 

11 

18 


22 

31 

37 

61 

72 

81 


97 

112 

118 

127 

131 

140 


151 

159 

177 

206 




Utilice la regresión logística generada por MINITAB que 
aparece a continuación, para determinar si la edad parece 
tener un impacto significativo en la presencia de cifosis. 

25. Los siguientes datos resultaron de un estudio encargado por 
una gran empresa de consultoría de administración, para in¬ 
vestigar la relación entre la cantidad de experiencia en el 
trabajo (meses) para un consultor subalterno y la probabili¬ 
dad de que el consultor sea capaz de realizar cierto trabajo 
complejo. 


Éxito 

8 

13 

14 

18 

20 

21 

21 

22 

25 


26 

28 

29 

30 

32 





Fracaso 

4 

5 

6 

6 

7 

9 

10 

11 

11 


13 

15 

18 

19 

20 

23 

27 




Interprete la regresión logística generada por MINITAB y 
trace una gráfica de la probabilidad estimada de rendimien¬ 
to en el trabajo como función de la experiencia. 


21 . 
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Tabla de regresión 

logística para 

el 

ejercicio 24 







Predictor 

Coef 


StDev 

Z 

P 

Odds Ratio 

95% Lower 

CI 

Upper 

Constant 

-0.5727 


0.6024 

-0.95 

0.342 





age 

0.004296 


0.005849 

0.73 

0.463 

1.00 

0.99 


1.02 

Tabla de regresión 

logística para 

el 

ejercicio 25 







Predictor 

Coef 


StDev 

Z 

P 

Odds Ratio 

95% Lower 

CI 

Upper 

Constant 

-3.211 


1.235 

-2.60 

0.009 





age 

0.17772 


0.06573 

2.70 

0.007 

1.19 

1.05 


1.36 


13.3 Regresión con polinomios 

Los modelos no lineales, pero intrínsecamente lineales de la sección 13.2, comprendían fun¬ 
ciones de la variable independiente x que eran estrictamente crecientes o estrictamente de¬ 
crecientes. En numerosas situaciones, ya sea de un razonamiento teórico o de otro tipo, una 
gráfica de puntos sugiere que la verdadera función de regresión ¡± y , x tiene uno o más 
picos o valles, es decir, al menos un mínimo o máximo relativos. En tales casos, una fun¬ 
ción con polinomios y = /3 0 + + • • • + ¡3 k x k puede dar una aproximación satisfactoria 

a la verdadera función de regresión. 



DEFINICIÓN 

La ecuación del modelo de regresión con polinomios de grado k es 



Y = óo + Pi x + /3 2 Jc 2 + • • ■ + ¡8 k x k + e 
donde e es una variable aleatoria normalmente distribuida con 

(13.6) 


/r e = 0 a-2 = (T 1 

(13.7) 



De (13.6) y (13.7), se deduce de inmediato que 

Vy-x = Po + Pi* + ' ' ' + c 2 y-x = v 2 (13-8) 

En otras palabras, el valor esperado de Y es una función con polinomios de A'-ésimo grado 
de x, mientras que la varianza de Y, que controla la dispersión de valores observados alre¬ 
dedor de la función de regresión, es la misma para cada valor de x. Se supone que los pares 
observados (x,, v,), . . . , (x„, y n ) se generaron de manera independiente del modelo (13.6). 
La figura 13.10 ilustra un modelo cuadrático y cúbico. 



a) 


b) 


Figura 13.10 a) Modelo de regresión cuadrático; b) modelo de regresión cúbico. 
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Estimación de parámetros usando mínimos cuadrados 

Para estimar ¡3 0 , ¡3^ ... , ¡3 k , considere una función de regresión de ensayo y = b 0 + b x x + 

■ • ■ + b k jc k . Entonces la bondad de ajuste de esta función a los datos observados se puede 
evaluar al calcular la suma de desviaciones al cuadrado 

f(b 0 , b lt . . ., b k ) = Y [y¡ - ib 0 + b ] x¡ + b 2 x 2 + • • • + b^)] 2 (13.9) 

i=l 

Según el principio de mínimos cuadrados, las estimaciones /3 0 , jS¡, . . . , f3 k son los valores 
de b 0 , b v ... , b k que minimizan la expresión (13.9). Debe observarse que cuando jc¡, x 2 , . . ., 
x n son todas diferentes, hay un polinomio de grado n — 1 que se ajusta a los datos perfecta¬ 
mente, de modo que el valor minimizador de (13.9) es 0 cuando k = n — 1. No obstante, 
en casi todas las aplicaciones, el modelo con polinomios (13.6) con k grande es bastante 
irreal, y en la mayor parte de aplicaciones k = 2 (cuadrático) o k = 3 (cúbico) es apropiado. 

Para hallar los valores minimizadores en (13.9), se toman las k + 1 derivadas parcia¬ 
les df/db 0 , df/db v . . . , df/db k y se igualan a 0, lo cual produce el sistema de ecuaciones 
normales para las estimaciones. Debido a que la función de ensayo b 0 + b¡x + • • • + b¡^ 
es lineal en b 0 , . . . , b k (aunque no en x), las k + 1 ecuaciones normales son lineales en las 
incógnitas: 




Todos los paquetes de computadora estándar de estadística resolverán de manera automáti¬ 
ca las ecuaciones de (13.10) y darán las estimaciones junto con otra gran cantidad de infor¬ 
mación.* 

Ejemplo 13.7 El artículo “Residual Stresses and Adhesión of Thermal Spray Coatings” (Surface Enginee- 
ring, 2005: 35-40) consideró la relación entre el grosor (/im) de capas de NiCrAl deposita¬ 
das en sustrato de acero inoxidable y la resistencia a la adherencia (MPa). Los datos que 
aparecen a continuación se interpretaron de una gráfica del artículo antes citado. 


Grosor 

220 

220 

220 

220 

370 

370 

370 

370 

440 

440 

Resistencia 

24.0 

22.0 

19.1 

15.5 

26.3 

24.6 

23.1 

21.2 

25.2 

24.0 


Grosor 

440 

440 

680 

680 

680 

680 

860 

860 

860 

860 

Resistencia 

21.7 

19.2 

17.0 

14.9 

13.0 

11.8 

12.2 

11.2 

6.6 

2.8 


La gráfica de puntos de la figura 13.11a) apoya la selección del modelo de regresión cua¬ 
drático. La figura 13.1 Ib) contiene una salida de MINITAB de un ajuste de este modelo. Los 
coeficientes estimados de regresión son 

/§„ = 14.521 j8, = 0.04323 /3 2 = -0.00006001 



En la sección 13.4 se estudia que la regresión con polinomios es un caso especial de regresión múltiple, de mo¬ 
do que en general se usa un comando apropiado para este último trabajo. 
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13.3 Regresión con polinomios 521 

de los que la función estimada de regresión es 

y = 14.521 + 0.04323* - 0.00006001* 2 

La sustitución de valores de x sucesivos 220, 220, . . . , 860 y 860 en esta función da los va¬ 
lores pronosticados 5q = 21.128, . . . , y 2 o = 7.321 y los residuos y¡ — y¡ = 2.872, . . . , 
y 20 — y 20 = —4.521 resultan de sustracción. La figura 13.12 muestra una gráfica de los re¬ 
siduos estandarizados en función de y y también una gráfica de probabilidad normal de los 
residuos estandarizados, los cuales validan el modelo cuadrático. 



The regression equation is 

strength = 14.5 + 0.0432 thickness - 0.000060 thicksqd 


P 

0.007 
0.043 
0.004 

S = 3.26937 R-Sq = 78.0% R-Sq(adj) = 75.4% 

Analysis of Variance 


Predictor 

Constant 

thickness 

thicksqd 


Coef 

14.521 

0.04323 

-0.00006001 


SE Coef 
4.754 
0.01981 
0.00001786 


T 

3.05 
2.18 
-3.36 


Source 

DF 

Regression 

2 

Residual Error 

17 

Total 

19 


SS MS F P 

643.29 321.65 30.09 0.000 

181.71 10.69 

825.00 


Predicted Valúes for New Observations 


New 

Obs Fit 

1 21.136 

2 10.704 


SE Fit 95% CI 

1.167 (18.674, 23.598) 

1.189 ( 8.195, 13.212) 


95% PI 

(13.812, 28.460) 
( 3.364, 18.043) 


Valúes of Predictors for New Observations 


New 

Obs 

1 

2 


thickness 

500 

800 


thicksqd 

250000 

640000 


b) 


Figura 13.11 a) Gráfica de puntos de datos del ejemplo 13.7 b) Salida MINITAB del ajuste del mode¬ 
lo cuadrático. 
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Grfic a de probabilidad normal de residuos 



Residuo estandarizado 


Residuo en fundón de los valores ajustados 



8 12 16 20 24 


Valor ajustado 


Figura 13.12 Gráfica de diagnóstico para ajuste de modelo cuadrático a datos del ejemplo 13.7. ■ 



& 2 y R 2 

Para hacer inferencias adicionales acerca de los parámetros de la función de regresión, de¬ 
be estimarse la varianza de error a 2 . Con y¡ = /3 0 + j 8 l x i + ■ ■ ■ + fi k x¡,, el residuo í-ésimo 
es y¡ — y¡ y la suma del cuadrado de residuos (suma de los cuadrados del error) es SCE = 
X(y¿ — y,) 2 . La estimación de a 2 es entonces 


SCE 


n — (k + 1) 


= CME 


(13.11) 


donde el denominador n — (k + 1) se usa porque k + 1 grados de libertad se pierden al es¬ 
timar /3 0 , Pp . . . , [3 t . 

Si de nuevo se hace STC = Z(y, — y) 2 , entonces SCE/STC es la proporción de la va¬ 
riación total en las y¡ observadas que no es explicada por el modelo con polinomios. La can¬ 
tidad 1 — SCE/STC, la proporción de variación explicada por el modelo, recibe el nombre 
de coeficiente de determinación múltiple y se denota con R 2 . 

Suponga que se considera ajustar un modelo cúbico a los datos del ejemplo 13.7. De¬ 
bido a que el modelo cúbico incluye el cuadrático como un caso especial, el ajuste de un 
cúbico será al menos tan bueno como el ajuste a un cuadrático. En forma más general, con 
SCEj. = suma de los cuadrados del error de un polinomio de A-ésimo grado, SCE ; ., < SCE Á . 
y R 2 , > R 2 siempre que k! > k. Como el objetivo del análisis de regresión es hallar un mo¬ 
delo que sea sencillo (con relativamente pocos parámetros) y que dé un buen ajuste a los da¬ 
tos, un polinomio de grado superior puede no especificar un modelo mejor que un modelo 
de grado inferior a pesar de su mayor valor de R 2 . Para equilibrar el costo de usar más pa¬ 
rámetros contra la ganancia en R 2 , muchos expertos en estadística usan el coeficiente ajus¬ 
tado de determinación múltiple 


« ii i 

R- ajustada =1- 

J n - (k + 1) 


SCE 

STC 


(;n - l)fl 2 - k 
n 1 k 


(13.12) 


La R 2 ajustada iguala hacia arriba la proporción de variación no explicada [porque la razón 
(n — I )Kn — k — 1) excede de 1], que resulta en R 2 ajustada < R 2 . Entonces, si R\ = 0.66, 
R 2 = 0.70 y n = 10, entonces 


R 2 ajustada = 9( °' 66) —- = 0.563 
2 J 10-3 


ajustada R\ 


9(0.70) - 3 
10-4 


0.550 


de modo que la pequeña ganancia en R 2 , al pasar de un modelo cuadrático a uno cúbico, no 
es suficiente para compensar el costo de sumar un parámetro extra al modelo. 
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Ejemplo 13.8 

(Continúa del 
ejemplo 13.7) 


SCE y STC se encuentran por lo general en salidas de computadora en una tabla ANOVA. 
La figura 13.11b) da SCE = 181.71 y STC = 825.00, para los datos de resistencia a la 
adherencia, de donde R 2 = 1 — 181.71/825.00 = 0.780 (alternativamente, R 2 = SCR/STC = 
643.29/825.00 = 0.780). Así, 78.0% de la variación observada en resistencia a la adheren¬ 
cia se puede atribuir a la relación del modelo. R 2 ajustada = 0.754, es sólo un pequeño 
cambio hacia abajo en R 2 . Las estimaciones de cr y a son 


SCE 

n ~ (k + 1) 


181.71 

20 - (2 + 1 ) 


10.69 


& = s = 3.27 ■ 

Además de calcular R 2 y ajustar R 2 , se deben examinar las gráficas de diagnóstico 
usuales para determinar si son válidas las suposiciones del modelo o si puede ser apropiada 
una modificación. 


Intervalos estadísticos y procedimientos de prueba 

Debido a que las y¡ aparecen en las ecuaciones normales (13.10) sólo en el lado derecho y 
en forma lineal, las estimaciones resultantes ¡3 0 , ... ,(3 k son por sí mismas funciones linea¬ 
les de las y¡. En esta forma, los estimadores son funciones lineales de las Y¡, de modo que 
cada /3, tiene una distribución normal. También se puede demostrar que cada /3, es un esti¬ 
mador insesgado de /3,. 

La desviación estándar del estimador j8, se denota con cr^. Esta desviación estándar 
tiene la forma 


expresión complicada que comprende todas las 
.Xj’Xj,... ,y Xj 


Por fortuna, la expresión dentro de llaves se ha programado en todos los paquetes compu- 
tarizados de estadística que se usan con más frecuencia. La desviación estándar estimada de 
j8¡, Sp., resulta de sustituir s en lugar de cr en la expresión para cr^. Estas desviaciones están¬ 
dar estimadas .y^, sp t ,... , y s^, aparecen en la salida de todos los paquetes de estadística ci¬ 
tados líneas antes. Se denota con el estimador de tr^, es decir, la variable aleatoria cuyo 
valor observado es s^. Entonces se puede demostrar que la variable estandarizada 


T = 


P i ~ J3, 




(13.13) 


tiene una distribución t basada en n — (k + 1) grados de libertad. Esto lleva a los proce¬ 
dimientos inferenciales siguientes. 


Un intervalo de confianza (IC) 100(1 — a)% para ¡3¡, el coeficiente de x' de la función 
de regresión con polinomios, es 

Pi — t a /2,n—(k+l) ' S f3t 

Una prueba de H 0 : = ¡B i0 está basada en el valor estadístico t 

t — Pi ~ A'O 

s p, 

La prueba está basada en n — (k + 1) grados de libertad y es de cola superior, cola in¬ 
ferior, o de dos colas, según si la desigualdad H. d es >, < o A. 


Una estimación puntual de ¡x Y . x es decir, de /3 0 + /3¡x + ■ ■ • + (ifX k , es pu Y . x = j8 0 + 
/3¡x + • ■ • + /3 k x k . La desviación estándar estimada del estimador correspondiente es más 
bien complicado. Numerosos paquetes de computadora darán esta desviación estándar 
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Ejemplo 13.9 

(Continúa del 
ejemplo 13.8) 


estimada para cualquier valor de x cuando un usuario lo pida. Esto, junto con una variable 
t estandarizada apropiada, se puede usar para justificar los procedimientos siguientes. 


Se denota con x* un valor especial de x. Un intervalo de confianza (IC) 100(1 — a)% 
para ¡jl y . x ,, es 

f Desv. Est. estimada de] 

A Y-x* — ^a/2,n—(k+l) ' 1 Ay * [ 

Con Y = ¡ 3 0 + 0 { x* + • • • + ¡i k (x*f,y denotando el valor calculado deFpara los da¬ 
tos dados y s$ denotando la desviación estándar estimada de la estadística K, la fórmu¬ 
la para el intervalo de confianza es muy semejante a la del caso de regresión lineal 
simple: 

Y — ta/2,n-(k+l) ' S Y 


Un intervalo de predicción 100(1 — a)% para un valor y futuro a observar cuando 
x = x* es 


A Y-x* — K 


a/2,n-(k+l) 


S 2 + 


Desv. Est. estimada \ 2 ' 

de Ay.** J 


1/2 


= y±t ( 


a!2,n—(k+\) 




La figura 13.11b) muestra que 0 2 = —0.00006001 y s¡y = 0.00001786 (de la columna de 
coeficientes SE al principio de la salida). La hipótesis nula H 0 : /3 2 = 0 dice que mientras la 
pronosticadora lineal x se retenga en el modelo, la pronosticadora cuadrática x 1 no propor¬ 
ciona información útil adicional. La alternativa relevante es Ify. ¡i 2 0 y la estadística de 

prueba es T = con valor calculado —3.36. La prueba está basada en n — (k + 1) = 

17 grados de libertad. Al nivel de significación de 0.05, la hipótesis nula es rechazada por¬ 
que — 3.36 ^ —2.110 = —íqo 25 17 - La inclusión de la pronosticadora cuadrática se justifica. 
La misma conclusión resulta de comparar el valor P reportado de 0.004 al nivel escogido de 
significación de 0.05. 

La salida de la figura 13.11b) también contiene información de estimación y predic¬ 
ción para x = 500 y para x = 800. En particular, para x = 500, 

y =/3 0 + 01(500) + 0 2 (5OO) 2 = Ajuste = 21.136 
Sy = Desv. Est. estimada de Y = SE Ajuste = 1.167 

de la cual un intervalo de confianza de 95% para resistencia media cuando el grosor es = 500 
es 21.136 ± (2.110)( 1.167) = (18.67, 23.60). Un intervalo de predicción de 95% para la re¬ 
sistencia que resulta de una sola adherencia cuando el grosor es = 500 es 21.136 ± 
(2.110)[(3.27) 2 + (1.167) 2 ] 1/2 = (13.81, 28.46). Como ya se dijo antes, el intervalo de predic¬ 
ción es considerablemente más ancho que el intervalo de confianza porque s es grande en 
comparación con el ajuste del error estándar (SE). ■ 


Centrado de valores x 

Para el modelo cuadrático con función de regresión p. K . c = j8 0 + /3¡x + finX 2 , los parámetros 
/3 0 , /3 j y /3, caracterizan el comportamiento de la función cerca de x = 0. Por ejemplo, ¡3 0 es 
la altura a la que la función de regresión cruza el eje vertical x = 0, mientras que j8[ es la 
primera derivada de la función en x = 0 (rapidez de cambio instantánea de ¡i Y . x en x = 0). 
Si todas las x¡ están lejos de 0, no se puede tener información precisa acerca de los valores 
de estos parámetros. Sea i = promedio de las jc ; para las que se toman observaciones, y con¬ 
sidere el modelo 

Y = /3§ + ¡3^(x — x) + /BfC* — *) 2 + € (13.14) 

En el modelo (13.14), /l y . x = /3j§ + /) j(.r — x) + j8?(x — x) 2 , y los parámetros ahora descri¬ 
ben el comportamiento de la función de regresión cerca del centro x de los datos. 

Para estimar los parámetros de (13.14), simplemente se resta x de cada x¡ para obte¬ 
ner x¡ = x¡ — x, y luego se usan las x\ en lugar de las x¡. Un beneficio importante de esto es 
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que los coeficientes de b 0 , , b k de las ecuaciones normales (13.10) serán de magnitud 

mucho menor de lo que sería el caso si se usaran las x¡ originales. Cuando el sistema se re¬ 
suelve en computadora, este centrado protege contra cualquier error de redondeo que pue¬ 
da resultar. 

Ejemplo 13.10 


X 

280 

284 

292 

295 

298 

305 

308 

315 

x' 

-17.13 

-13.13 

-5.13 

-2.13 

0.87 

7.87 

10.87 

17.87 

y 

770 

800 

840 

810 

735 

640 

590 

560 


Un análisis de computadora dio los resultados que se ilustran en la tabla 13.4. 

Tabla 13.4 Coeficientes estimados y desviaciones estándar para el ejemplo 13.10 


Parámetro 

Estimado 

DE estimada 

Parámetro 

Estimado 

DE estimada 

0o 

-26219.64 

11912.78 

P*o 

759.36 

23.20 

0i 

189.21 

80.25 

0! 

-7.61 

1.43 

02 

-0.3312 

0.1350 

0? 

-0.3312 

0.1350 


El artículo “A Method for Improving the Accuracy of Polynomial Regression Analysis” 
(, J. Quality Technology, 1971: 149-155) informa acerca de los datos siguientes sobre x = 
temperatura de cura (°F) y y = resistencia máxima al corte de un compuesto de caucho (en 
libras por pulgada cuadrada), con x = 297.13: 


La función de regresión estimada usando el modelo original es y = —26219.64 + 
1 89.21jc — 0.331 2x 2 , mientras que el modelo centrado de la función es y = 759.36 — 
7.61 (x — 297.13) — 0.331 2(x — 297.13) 2 . Estas funciones estimadas son idénticas; la úni¬ 
ca diferencia es que se han estimado parámetros diferentes para los dos modelos. Las des¬ 
viaciones estándar estimadas indican con claridad que /3q y j3* se han estimado con más 
precisión que ¡ 3 0 y Los parámetros cuadráticos son idénticos (/3 2 = j3|), como se puede 
ver al comparar el término x 2 en (13.14) con el modelo original. Otra vez se destaca aquí 
que un beneficio importante del centrado es la ganancia en precisión computacional, no só¬ 
lo en modelos cuadráticos sino de orden superior. ■ 

El libro de Neter y otros, que aparece en la bibliografía del capítulo, es una buena 
fuente de más información acerca de una regresión con polinomios. 


EJERCICIOS Sección 13.3 (26-35) 


26. Además de una regresión lineal de densidad verdadera so¬ 
bre el contenido de humedad, el artículo citado en el ejerci¬ 
cio 6 consideró una regresión cuadrática de densidad por 
volumen contra el contenido de humedad. A continuación 
aparecen datos de una gráfica del artículo, junto con una sa¬ 
lida MINITAB del ajuste cuadrático. 

The regression equation is 

bulkdens = 403 + 16.2 moiscont — 0.706 contsqd 


Predictor 

Coef 

StDev 

T 

P 

Constant 

403.24 

36.45 

11.06 

0.002 

moiscont 

16.164 

5 

.451 

2.97 

0.059 

contsqd 

-0.7063 

0.1852 

-3.81 

0.032 

S — 10.15 R 

-Sq =93.8% 

R- 

Sq(adj) : 

= 89.6% 


Analysis of 

Variance 





Source 

DF 

SS 

MS 

F 

P 

Regression 

2 4637 

.7 

2318.9 

22.51 

0.016 

Residual Error 3 309 

.1 

103.0 



Total 

5 4946 

.8 





(i continúa en la parte superior de la siguiente columna) 


Analysis of Variance 









StDev 




st 

Obs 

moiscont 

bulkdens 

Fit 

Fit 

Residual 

Resid 

1 

7 , 

.0 

479 . 

.00 

481 

.78 

9.35 

-2 , 

.78 

-0. 

.70 

2 

10, 

.3 

503 , 

.00 

494 

.79 

5.78 

8. 

.21 

0. 

.98 

3 

13 , 

.7 

487 , 

.00 

492 

.12 

6.49 

-5 . 

.12 

-0. 

.66 

4 

16, 

.6 

470 , 

.00 

476 

.93 

6.10 

-6. 

.93 

-0, 

.85 

5 

19, 

.8 

458, 

.00 

446 

.39 

5.69 

11. 

.61 

1. 

.38 

6 

22 , 

.0 

412 , 

.00 

416 

.99 

8.75 

-4 . 

.99 

-0. 

.97 


StDev 

Fit Fit 95.0% CI 95.0% PI 

491.10 6.52 (470.36, 511.83) (452.71, 529.48) 


a. La gráfica de puntos de los datos, ¿parece consistente 
con el modelo de regresión cuadrático? 

b. ¿Qué proporción de variación observada en densidad se 
puede atribuir a la relación del modelo? 

c. ¿Parece útil el modelo cuadrático? Realice una prueba al 
nivel 0.05 de significación. 
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d. La última línea de la salida es de una información de peti¬ 
ción de estimación y predicción cuando el contenido de 
humedad es 14. Calcule un intervalo de predicción de 99% 
para densidad cuando el contenido de humedad sea de 14. 

e. ¿El predictor cuadrático parece dar información útil? 
Pruebe las hipótesis apropiadas al nivel 0.05 de signifi¬ 
cación. 

27. Los datos siguientes sobre y = concentración de glucosa 
(g/1), y x = tiempo de fermentación (días) para una mezcla 
particular de licor de malta, se leyeron de una gráfica de 
puntos del artículo “Improving Fermentation Productivity 
with Reverse Osmosis” (Food Tech., 1984: 92-96): 



i 

2 

3 

4 

5 

6 

7 

8 

y 

74 

54 

52 

51 

52 

53 

58 

71 


a. Verifique que una gráfica de puntos de los datos sea con¬ 
sistente con la selección de un modelo de regresión cua¬ 
drático. 


b. La ecuación de regresión cuadrática estimada es y = 
84.482 — 15.875* + 1.7679x 2 . Pronostique el valor de 
concentración de glucosa para un tiempo de fermenta¬ 
ción de 6 días, y calcule el residuo correspondiente. 

c. Usando SCE = 61.77, ¿qué proporción de variación ob¬ 
servada se puede atribuir a la relación de regresión cua¬ 
drática? 

d. Los n = 8 residuos estandarizados basados en el mode¬ 
lo cuadrático son 1.91, —1.95, —0.25, 0.58, 0.90, 0.04, 
— 0.66 y 0.20. Construya una gráfica de los residuos 
estandarizados contra * y una gráfica de probabilidad nor¬ 
mal. ¿Estas gráficas muestran algunas características 
problemáticas? 

e. La desviación estándar estimada de fi Y . 6 , es decir, 0 O + 
0¡(6) + /3,(36), es 1.69. Calcule un intervalo de confian¬ 
za de 95% para ¡jl y . 6 . 

f. Calcule un intervalo de predicción de 95% para una ob¬ 
servación de concentración de glucosa hecha después de 
6 días de tiempo de fermentación. 

28. La viscosidad (y) de un aceite se midió con un cono y un vis- 
cosímetro de plato a seis velocidades de cono diferentes (x). 
Se supuso que un modelo de regresión cuadrático era 
apropiado, y la función de regresión estimada resultante de 
las n = 6 observaciones fue 

y = -113.0937 + 3.3684x - 0.01780* 2 

a. Estime ¿iy. 75 , la viscosidad esperada cuando la velocidad 
es 75 rpm. 

b. ¿Qué viscosidad se pronosticaría para una velocidad de 
cono de 60 rpm? 

c. Si Iy 2 = 8 386.43, Zy¡ = 210.70, 'Zx ¡ y i = 17 002.00, 
y 2x?y,. = 1419 780, calcule SCE [ = Zyf - 0^ - 

- ftSxfy,], s 2 y i. 

d. Del inciso c), STC = 8386.43 - (210.0) 2 /6 = 987.35. 
Usando el SCE calculado en el inciso c), ¿cuál es el va¬ 
lor calculado de R 2 ? 

e. Si la desviación estándar estimada de 0 , es s^ 2 = 
0.00226, pruebe H 0 : f) 2 — 0 contra // a : jS-, A 0 al nivel 
0.01, e interprete el resultado. 

29. En años recientes se han investigado de manera extensa los 
productos moldeables refractarios de alta alúmina por sus 
importantes ventajas sobre otros ladrillos refractarios de la 


misma clase, por ejemplo, menos costos de producción y 
aplicación, versatilidad y rendimiento a altas temperaturas. 
Los datos siguientes sobre x = viscosidad (MPa ■ s) y y = 
derrame libre (%) se obtuvieron de una gráfica del artículo 
“Processing of Zero-Cement Self-Flow Alumina Castables” 
(The Amer. Ceramic Soc. Bull., 1998: 60-66): 


X 

351 

367 

373 

400 

402 

456 

484 

y 

81 

83 

79 

75 

70 

43 

22 


Los autores del artículo científico citado relacionaron estas 
dos variables usando un modelo de regresión cuadrático. La 
función de regresión estimada es y = —295.96 + 2.1885x — 
0.0031662x 2 . 

a. Calcule los valores y residuos pronosticados, y luego 
SCE y í 2 . 

b. Calcule e interprete el coeficiente de determinación 
múltiple. 

c. La desviación estándar (DE) de /3-, es s £ = 0.0004835. 
¿El predictor cuadrático pertenece al modelo de regre¬ 
sión? 

d. La desviación estándar (DE) estimada de f) ¡ es 0.4050. 
Use esto y la información en c) para obtener los interva¬ 
los de confianza conjuntos para los coeficientes de re¬ 
gresión cuadrática y lineal con un nivel de confianza 
conjunto de (al menos) 95 por ciento. 

e. La desviación estándar estimada de fi Y . m es 1.198. Calcu¬ 
le un intervalo de confianza de 95% para un derrame libre 
promedio cuando la viscosidad = 400 y también un in¬ 
tervalo de predicción de 95% para derrame libre que 
resulte de una sola observación hecha cuando la viscosi¬ 


dad es = 400, y compare los intervalos. 

30. El artículo “A Simulation-Based Evaluation of Three Crop- 
ping Systems on Cracking-Clay Soils in a Summer Rainfall 
Environment” (Agricultural Meteorology, 1976: 211-229) 
propone un modelo cuadrático para la relación entre el ín¬ 
dice (x) de suministro de agua y la producción (y) de trigo. 
A continuación aparecen datos representativos y la genera¬ 
da por MINITAB: 


X 

1.2 

1.3 

1.5 

1.8 

2.1 

2.3 

2.5 

y 

790 

950 

740 

1230 

1000 

1465 

1370 

X 

2.9 

3.1 

3.2 

3.3 

3.9 

4.0 

4.3 

y 

1420 

1625 

1600 

1720 

1500 

1550 

1560 


The regression equation is 

yield = —252 + 1000 Índex — 135 indexsqd 


Predictor Coef 
Constant -251.6 
Index 1000.1 
Indexsqd -135.44 


Stdev 

285.1 

229.5 

41.97 


t-ratio 

- 0.88 

4.36 

-3.23 


P 

0.396 

0.001 

0.008 


s = 135.6 R-sq = 85.3% R-sq(adj ) =82.6% 


Analysis of Variance 


SOURCE 

DF 

SS 

MS F 

P 

Regression 

2 

1170208 

585104 31.83 

0.000 

Error 

11 

202228 

18384 


Total 

13 

1372435 




a. Interprete el valor del coeficiente de determinación 
múltiple. 

b. Calcule un intervalo de confianza de 95% para el coefi¬ 
ciente del predictor cuadrático. 
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c. La desviación estándar estimada de j8 0 + P Y x + 0 2 x 2 
cuando x = 2.5 es 53.5. Pruebe H 0 : ¡jl y .-, 5 = 1500 contra 
// a : n Y . 2 ¡ < 1500 usando a = 0.01. 

d. Obtenga un intervalo de predicción de 95%, para pro¬ 
ducción de trigo cuando el índice de abastecimiento de 
agua es 2.5, usando la información dada en el inciso c). 

31. La información siguiente se obtuvo de un estudio de cierto 
método para preparar alcohol puro de corrientes de refine¬ 
ría (“Direct Hydration of Olefins”, Industrial and Eng. 
Chemistry , 1961: 209-211). La variable independiente x es 
la velocidad de espacio horario en volumen, y la variable 
dependiente y es la cantidad de conversión de isobutileno. 


X 

1 1 2 

4 

4 

4 

6 

y 

23.0 24.5 28.0 

30.9 

32.0 

33.6 

20.0 


a. Suponiendo que un modelo probabilístico cuadrático 
sea apropiado, estime la función de regresión. 

b. Determine los valores y residuos pronosticados, y cons¬ 
truya una gráfica de residuos. ¿La gráfica se ve aproxima¬ 
damente como se esperaba cuando el modelo cuadrático 
es correcto? ¿La gráfica indica que cualquier observación 
había tenido una gran influencia en el ajuste? ¿La gráfi¬ 
ca de puntos identifica un punto que tenga gran influen¬ 
cia? Si es así, ¿cuál punto? 

c. Obtenga i 2 y R 2 . ¿El modelo cuadrático da un buen ajus¬ 
te a los datos? 

d. En el ejercicio 11, se observó que el valor pronosticado 
Yj y el residuo Y- — Yj son independientes entre sí, de mo¬ 
do que a 2 = V(Yj) = V(Y¡) + V(Y ] - Y¡). Una salida 
impresa de computadora da las desviaciones estándar 
estimadas de los valores pronosticados como 0.955, 
0.955, 0.712, 0.777, 0.777, 0.777 y 1.407. Use estos va¬ 
lores junto con s 2 para calcular la desviación estándar 
estimada de cada residuo. Luego calcule los residuos es¬ 
tandarizados y dibújelos en función de x. ¿La gráfica se 
ve muy semejante a la gráfica del inciso b)? Suponga el 
lector que había estandarizado los residuos usando sólo 
í en el denominador. ¿Los valores resultantes diferirían 
mucho de los valores correctos? 

e. Usando información dada en el inciso d), calcule un inter¬ 
valo de predicción de 90% para conversión de isobutileno 
cuando la velocidad de espacio horario en volumen es 4. 

32. La información siguiente es un subconjunto de datos obte¬ 
nidos en un experimento para estudiar la relación entre el 
pH del suelo x y y = Al. La concentración ÍEC (“Root Res- 
ponses of Three Gramineae Species to Soil Acidity in an 
Oxisol and an Ultisol”, Soil Science, 1973: 295-302): 


X 

4.01 

4.07 

4.08 

4.10 

4.18 


y 

1.20 

0.78 

0.83 

0.98 

0.65 


X 

4.20 

4.23 

4.27 

4.30 

4.41 


y 

0.76 

0.40 

0.45 

0.39 

0.30 


X 

4.45 

4.50 

4.58 

4.68 

4.70 

4.77 

y 

0.20 

0.24 

0.10 

0.13 

0.07 

0.04 


Se propuso un modelo cúbico en el artículo, pero la versión 
de MINITAB empleada por el autor del presente texto re- 
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chazó incluir el término x 3 en el modelo, expresando que 
“x 3 está altamente correlacionada con otros variables pre- 
dictores”. Para solucionar esto, x = 4.3456 se restó de cada 
valor x para obtener x' = x — x. Se requirió entonces una 
regresión cúbica para ajustar el modelo teniendo la función 
de regresión 

y — Po + P* x ' + ¿8 ?(x') 2 + P%x’) 3 

Dio por resultado la siguiente salida de computadora: 


Parámetro 

Estimado 

DE estimada 

Po 

0.3463 

0.0366 

P* 

-1.2933 

0.2535 

P*2 

2.3964 

0.5699 

P* 

-2.3968 

2.4590 


a. ¿Cuál es la función de regresión estimada para el mode¬ 
lo “centrado”? 

b. ¿Cuál es el valor estimado del coeficiente )8 3 en el mo¬ 
delo “no centrado” con función de regresión y = /3 0 + 
/3[X + /3 2 x 2 + /3 3 x 3 ? ¿Cuál es la estimación de /S 2 ? 

c. Usando el modelo cúbico, ¿qué valor de y se pronostica¬ 
ría cuando el pH del suelo es de 4.5? 

d. Realice una prueba para determinar si el término cúbico 
debe ser retenido en el modelo. 

33. En numerosos problemas de regresión con polinomios, en 
lugar de ajustar una función de regresión “centrada” usan¬ 
do x' = x — x, la precisión en computadoras se puede me¬ 
jorar si se usa una función de la variable independiente 
estandarizada x' = (x — x)/s x , donde s x es la desviación es¬ 
tándar de las x¡. Considere ajustar la función de regresión 
cúbica y = Po + P* x ’ + J8*(x') 2 + /3*(x') 3 a los siguientes 
datos, que resultan de un estudio de la relación entre efi¬ 
ciencia de empuje y de cohetes impulsores supersónicos y 
el ángulo x de semidivergencia de la nariz del cohete (“Mo¬ 
re on Correlating Data”, CHEMTECH, 1976: 266-270): 


X 

5 

10 

15 

20 

25 

30 

35 

y 

0.985 

0.996 

0.988 

0.962 

0.940 

0.915 

0.878 


Parámetro 

Estimado 

DE estimada 

P*o 

0.9671 

0.0026 

P* 

-0.0502 

0.0051 

P*2 

-0.0176 

0.0023 

P* 

0.0062 

0.0031 


a. ¿Qué valor de y se pronosticaría cuando el ángulo de se¬ 
midivergencia sea 20? ¿Y cuando x = 25? 

b. ¿Cuál es la función de regresión estimada fi a + /3¡x + 
/3 2 x 2 +)3 3 x 3 para el modelo “no estandarizado”? 

c. Use una prueba de nivel 0.05 para determinar si el tér¬ 
mino cúbico debe borrarse del modelo. 

d. ¿Qué se puede decir acerca de la relación entre las SCE 
y las R 2 para modelos estandarizados y no estandariza¬ 
dos? Explique. 

e. La SCE para el modelo cúbico es 0.00006300, mientras 
que para un modelo cuadrático la SCE es 0.00014367. 
Calcule la R 2 para cada modelo. ¿La diferencia entre las 
dos sugiere que el término cúbico debe ser borrado? 
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34. La información siguiente resultó de un experimento para 
evaluar el potencial de tierras sin quemar de una mina de 
carbón, como medio para el crecimiento de plantas. Las 
variables son x = cationes extraíbles de ácido y y = acidez 
intercambiable/(capacidad total de intercambio de cationes) 
(“Exchangeable Acidity in Unburnt Colliery Spoil”, Natu- 
re, 1969: 161): 


X 

-23 

-5 

16 

26 

30 

38 

52 

y 

1.50 

1.46 

1.32 

1.17 

0.96 

0.78 

0.77 

X 

58 

67 

81 

96 

100 

113 


y 

0.91 

0.78 

0.69 

0.52 

0.48 

0.55 



La estandarización de la variable independiente x para 
obtener x' = (x — x)ts x , y el ajuste de la función de regre¬ 
sión y = Po + P* x ' + 0!(x') 2 , dieron la siguiente salida de 
computadora. 


Parámetro 

Estimado 

DE estimada 

Po 

0.8733 

0.0421 

0T 

-0.3255 

0.0316 

02 

0.0448 

0.0319 


a. Estime yi y . 50 . 

b. Calcule el valor del coeficiente de determinación múlti¬ 
ple (vea el ejercicio 28c)). 

c. ¿Cuál es la función de regresión estimada 0 O + jSjX + 
0 2 x 2 usando la variable x no estandarizada? 

d. ¿Cuál es la desviación estándar estimada de f) 2 calcula¬ 
da en el inciso c)? 

e. Realice una prueba usando las estimaciones estandariza¬ 
das para determinar si el término cuadrático debe retener¬ 
se en el modelo. Repita usando las estimaciones no 
estandarizadas. ¿Difieren sus conclusiones? 

35. El artículo “The Respiration in Air and in Water of the Lim- 
pets Patella caerulea and Patella lusitanica ” ( Comp. Bio- 
chemistry and Physiology, 1975: 407-411) propuso un 
sencillo modelo de potencia para la relación entre el ritmo 
de respiración y y la temperatura x para P. caerulea en aire. 
No obstante, una gráfica de ln(y) en función de x muestra 
una figura curva. Ajuste el modelo cuadrático de potencia 
Y = ae lix+yx ‘ • e a los datos siguientes. 


X 

10 

15 

20 

25 

30 

y 

37.1 

70.1 

109.7 

177.2 

222.6 



| 13.4 Análisis de regresión múltiple 

En regresión múltiple, el objetivo es construir un modelo probabilístico que relacione una 
variable dependiente y a más de una variable independiente o predictores. Represente con k 
el número de variables predictores (k > 2) y denote estos predictores por x¡, x 2 ,, x k . Por 
ejemplo, al tratar de predecir el precio de venta de una casa, se podría tener 
k = 3 con x, = tamaño (pie 2 ), x 2 = edad (años) y x 3 = número de habitaciones. 


DEFINICIÓN 


La ecuación general del modelo de regresión múltiple aditivo es 

Y = 0o + + &2 X 2 + • • • + PkXk + e (13.15) 

donde E(e) = 0 y V(e) = cr 2 . Además, para fines de prueba de hipótesis y calcular in¬ 
tervalos de confianza o intervalos de predicción, se supone que e está normalmente 
distribuida. 


Sean x*, x*, . . . , x* valores particulares de x v . . . , x k . Entonces (13.15) implica que 

^t...,í = i 8 o + /3i4+---+j8,4 (13.16) 

En esta forma, así como /3 0 + jSjX describe el valor medio Y como función de x en regresión 
lineal simple, la verdadera función de regresión (o población) /3 0 + j8 1 x 1 + ■ • ■ +0 k x k da 
el valor esperado de Y como función de jc¡, . . ., x k . Las j8 ; son los verdaderos coeficientes 
de regresión (o población). El coeficiente de regresión j3¡ se interpreta como el cambio es¬ 
perado en Y asociado con un aumento de una unidad en x l mientras x 2 , . ... x k se manten¬ 
gan fijos. Interpretaciones análogas se cumplen para ¡3-,,... , fi k . 
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Modelos con interacción 
y predictores cuadráticos 

Si un investigador ha obtenido observaciones en y , x l y x 2 , un modelo posible es Y = j8 0 + 
/Vi + fi 2 x 2 + e. No obstante, se pueden construir otros modelos al formar predictores y 
funciones matemáticas de x¡ y/o x 2 . Por ejemplo, con x 3 = xjy x 4 = x¡x 2 , el modelo 

Y = 0o + P 1*1 + 02*2 + 03*3 + 0 4 *4 + e 

tiene la forma general de (13.15). En general, no es sólo permisible para algunos predicto¬ 
res ser funciones matemáticas de otras sino también que, con frecuencia, sean altamente de¬ 
seables en el sentido de que el modelo resultante pueda ser mucho más exitoso para explicar 
la variación en y que cualquier otro modelo sin estas pronosticadoras. Esta discusión tam¬ 
bién muestra que la regresión con polinomios es ciertamente un caso especial de regresión 
múltiple. Por ejemplo, el modelo cuadrático Y = /3 0 + j8¡x + ¡i 2 x 2 + e tiene la forma de 
(13.15) con k = 2, x l = x y x 2 = x 2 . 

Para el caso de dos variables independientes, x¡ y x 2 , hay cuatro modelos útiles de re¬ 
gresión múltiple. 

1. El modelo de primer orden: 

Y = P 0 + /Vi + 02*2 + e 

2. El modelo de segundo orden sin interacción: 

Y = Po + /Vi + Pl x 2 + 03*1 + 04*2 + e 

3. El modelo con predictores de primer orden e interacción: 

Y- P 0 + /Vi 02*2 'Y 03*1*2 e 

4. El modelo de segundo orden completo o cuadrático completo: 

Y = ¡3 0 + /Vi + 02*2 + 03*1 + 04*2 + 05*1*2 + € 

La comprensión de las diferencias entre estos modelos es un primer paso importante en la 
construcción de modelos de regresión realistas a partir de las variables independientes bajo 
estudio. 

El modelo de primer orden es la generalización más fácil de regresión lineal simple. 
Expresa que para un valor fijo de cualquiera de las dos variables, el valor esperado de Y es 
una función lineal de la otra variable y que el cambio esperado en Y para un aumento uni¬ 
tario en x¡ (x 2 ) es j3¡ (/V independiente del nivel de x-, (x t ). Entonces, si se dibuja la fun¬ 
ción de regresión como una función de x { para diversos valores diferentes de x 2 , se obtiene 
como contornos de la función de regresión un conjunto de rectas paralelas, como se ve en 
la figura 13.13a). La función y = /3 0 + ¡3 l x l + (i 2 x 2 especifica un plano en espacio tridimen¬ 
sional; el primer modelo dice que cada uno de los valores observados de la variable depen¬ 
diente corresponde a un punto que se desvía verticalmente de este plano en una cantidad 
aleatoria e. 

Según el modelo de segundo orden sin interacción, si x-, es fija, el cambio esperado en 
Y para un aumento de 1 unidad en x, es 

00 + 0l(*l + 1) + 02*2 + 0 3 (* 1 + l) 2 + 04*2 

~ (00 01*1 02*2 03*1 04*?) — 01 ^ 03 2/3 3 X¡ 

Debido a que este cambio esperado no depende de x 2 , los contornos de la función de regre¬ 
sión para diferentes valores de x 2 son todavía paralelos entre sí. No obstante, la dependen¬ 
cia del cambio esperado en el valor de x¡ significa que los contornos son ahora curvas en 
lugar de rectas. Esto se ve en la figura 13.13b). En este caso, la superficie de regresión ya 
no es un plano en espacio tridimensional sino que es una superficie curvada. 
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Los contornos de la función de regresión para el modelo de primer orden con interac¬ 
ción son rectas no paralelas. Esto es porque el cambio esperado en Y cuando x¡ se aumenta 
en 1 es 

& "I" Pl( X l ~ >r 1) l^2 X 2 Píi X 1 1 ) X 2 ~ (/3 0 Pl X l @2 X 2 + @3 X 1 X 2) ~ fil @3 X 2 

Este cambio esperado depende del valor de x 2 , de modo que cada línea de contorno debe te¬ 
ner una pendiente diferente, como se ve en la figura 13.13c). La palabra interacción refleja 
el hecho de que un cambio esperado en Y, cuando una variable aumenta en valor, depende 
del valor de la otra variable. 

Por último, para el modelo completo de segundo orden, el cambio esperado en Y cuan¬ 
do x 2 se mantiene fijo mientras x¡ aumenta en 1 unidad es /3¡ + /3 3 + 2f5 ] x l + /3 5 x 2 , que es una 
función de x¡ y de x 2 . Esto implica que los contornos de la función de regresión son curvos 
y no paralelos entre sí, como se ilustra en la figura 13.13d). 



Figura 13.13 Contornos de cuatro funciones de regresión diferentes. 



Similares consideraciones aplican a modelos construidos a partir de más de dos varia¬ 
bles independientes. En general, la presencia de términos de interacción en el modelo im¬ 
plica que el cambio esperado en y depende no sólo de la variable que se aumenta o 
disminuye sino también de los valores de algunas de las variables fijas. Al igual que en 
ANOVA, es posible tener términos de interacción de avance más elevado (por ejemplo 
X[X 2 x 3 ), lo que hace más difícil la interpretación del modelo. 

Nótese que si el modelo contiene predictores de interacción o cuadráticos, la interpre¬ 
tación genérica de una ¡3 I dada previamente no es aplicable por lo general. Esto es porque 
entonces no es posible aumentar x¡ en 1 unidad y mantener fijos los valores de todos los otros 
predictores. 
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Ejemplo 13.11 


e 
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Modelos con predictores 
para variables categóricas 

Hasta este punto se ha considerado explícitamente la inclusión de sólo variables predicto¬ 
res cuantitativos (numéricos) en un modelo de regresión múltiple. Con el uso de codifica¬ 
ción numérica sencilla, las variables cualitativas (categóricas), por ejemplo, material para 
cojinetes (aluminio o cobre/plomo) o tipo de madera (pino, roble, o nogal), también se pue¬ 
den incorporar en un modelo. Hay que enfocarse primero en el caso de una variable dicotó- 
mica, una con sólo dos categorías posibles, hombre o mujer, de manufactura norteamericana 
o extranjera, etc. Con cualquiera de estas variables, se asocia una variable indicadora x o 
imaginaria cuyos posibles valores 0 y 1 indican qué categoría es relevante para cualquier 
observación particular. 


El artículo “Estimating Urban Travel Times: A comparative Study” ( Trans. Res., 1980: 173- 
175) describió un estudio que relacionaba la variable dependiente y = tiempo de viaje en¬ 
tre lugares en cierta ciudad y la variable independiente x-, = distancia entre lugares. Dos 
tipos de vehículos, autos de pasajeros y camiones, se emplearon en el estudio. Sea 

1 si el vehículo es un camión 
1 (0 si el vehículo es un auto de pasajeros 


Un posible modelo de regresión múltiple es 

Y = P 0 + /Vi + 02 x 2 + e 

El valor medio de tiempo de viaje depende de si un vehículo es un auto o un camión: 


tiempo medio = /3 0 + f3 2 x 2 cuando x, = 0 (autos) 

tiempo medio = ¡3 0 + ¡3 l + ¡3 2 x 2 cuando x¡ = I (camiones) 

El coeficiente ¡3 l es la diferencia en tiempos medios entre camiones y autos con la distan¬ 
cia mantenida fija; si (} l > 0, a los camiones les tomará más tiempo en promedio recorrer 
cualquier distancia particular que a los autos. 

Una segunda posibilidad es un modelo con un predictor de interacción: 

Y — /3q T ¡i |X| + ¡3 2 x 2 + + € 

Ahora los tiempos medios para los dos tipos de vehículos son 


tiempo medio = /3 0 + ¡3 2 x 2 cuando x'j = 0 

tiempo medio = /3 0 + ¡3 l + (/3 2 + /3 3 )x 2 cuando x 3 = 1 

Para cada modelo, la gráfica del tiempo medio contra distancia es una recta para cualquiera de 
los dos tipos de vehículo, como se ilustra en la figura 13.14. Las dos rectas son paralelas 


Media y 



Media y 




Figura 13.14 Funciones de regresión para modelos con una variable imaginaria (x,) y una va¬ 
riable cuantitativa x 2 : a) sin interacción; b) interacción. 























cl3_p500-567.qxd 3/12/08 4:34 AM Page 532 



532 CAPÍTULO 13 Regresión múltiple y no lineal 


para el primer modelo (sin interacción), pero en general tendrán diferentes pendientes cuan¬ 
do el segundo modelo es correcto. Para este último modelo, el cambio en tiempo medio de 
viaje asociado con un aumento de una milla en distancia depende de qué tipo de vehícu¬ 
lo se trata, las dos variables “tipo de vehículo” y “tiempo de viaje” interactúan. De hecho, los 
datos recolectados por los autores del artículo citado líneas antes sugirieron la presencia de 
interacción. ■ 

Se podría pensar que la forma de manejar una situación de tres categorías es definir 
una sola variable numérica con valores codificados, como por ejemplo 0, 1 y 2 correspon¬ 
dientes a las tres categorías. Esto es incorrecto, porque impone un orden en las categorías 
que no está necesariamente implicado por el contexto del problema. El método correcto pa¬ 
ra incorporar tres categorías es definir dos variables imaginarias diferentes. Suponga, por 
ejemplo, que y es la vida útil de cierta herramienta de corte, x l es la velocidad de corte y que 
hay tres marcas de herramienta que se investigan. Entonces, sea 


1 si se usa la herramienta marca A 
0 de otro modo 


1 si se usa la herramienta marca B 
0 de otro modo 


Cuando se hace una observación en una herramienta marca A, x 2 = 1 yi 3 = 0, mientras que 
para una herramienta marca B, x 2 = 0 y x 3 = 1. Una observación hecha en una herramien¬ 
ta marca C tiene x 2 = x 3 = 0 y no es posible que x 2 = x 3 = 1 porque una herramienta no 
puede ser al mismo tiempo marca A y marca B. El modelo sin interacción tendría sólo las 
pronosticadoras x u x 2 y x 3 . El siguiente modelo con interacción permite que el cambio me¬ 
dio en duración, asociado con un aumento de una unidad en velocidad, dependa de la mar¬ 
ca de herramienta: 



Y = 00 + 01*1 + 02*2 + 03*3 + 04*1*2 + 05*1*3 + e 

La construcción de una imagen como la figura 13.14, con una gráfica para cada uno de los 
tres pares posibles ( x 2 , x 3 ), da tres líneas no paralelas (a menos que /3 4 = j3 5 = 0). 

En forma más general, incorporar una variable categórica con c posibles categorías en 
un modelo de regresión múltiple requiere el uso de c — 1 variables indicadoras (por ejem¬ 
plo, cinco marcas de herramientas necesitarían usar cuatro variables indicadoras). Entonces, 
incluso una variable categórica puede sumar numerosos predictores a un modelo. 

Estimación de parámetros 

Los datos en regresión lineal simple constan de n pares (x¡, y 3 ), . . . , (x„, y n ). Suponga que 
un modelo de regresión múltiple contiene dos variables predictores, x¡ y x 2 . Entonces, el 
conjunto de datos estará formado por n tripletas (x u , x 2¡ , y¡), (x 12 , x 22 , y 2 ), . . ., (x ln , x 2 „, y n ). 
Aquí el primer subíndice de x se refiere al predictor y el segundo al número de observa¬ 
ción. Más generalmente, con k predictores, los datos constan de n (k + 1) múltiplos (x n , 
* 21 , . . . , x kl , y t ), (x 12 , x 22 , . . . , x k2 , y 2 ), . . . , (x lH , x 2 „, . . . , x kn , y„), donde x tj es el valor 
del í-ésimo predictor x¡ asociado con el valor observado y. Se supone que las y han sido ob¬ 
servadas independientemente entre sí de acuerdo con el modelo (13.15). Para estimar los 
parámetros /3 0 , //, . . . , fi k usando el principio de mínimos cuadrados, forme la suma de 
desviaciones cuadradas de las y observadas desde una función de ensayo 
y = b 0 + Vi + • • • + Ve 

f(b 0 , b v . . . , b k ) = ^ [y¡ ~ ( b 0 + V y 4- b 2 x 2j + • • • + b^)] 2 (13.17) 

j 

Las estimaciones de mínimos cuadrados son los valores de las b t que minimizan f(b {] , . . . , 
b k ). Si se toma la derivada parcial de/con respecto a cada una de las b¡(j = 0, 1, ... , k) 
y se igualan a cero todas las parciales, se obtiene el siguiente sistema de ecuaciones normales: 
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Estas ecuaciones son lineales en las incógnitas b 0 , b r ,, b k . Al resolver (13.18) se obtienen 
las estimaciones de mínimos cuadrados ¡3 0 , , (i k . Esto se hace mejor si se utiliza 

el paquete de software de estadística. 

Ejemplo 13.12 El artículo “How to Optimize and Control the Wire Bonding Process: Part II” Solid State 
Technology, Jan. 1991: 67-72) describió un experimento realizado para evaluar el impacto de 
las variables x¡ = fuerza (gm), x 2 = potencia (mW), x 3 = temperatura (°C) y x 4 = tiempo 
(ms) en y = resistencia de pegamento al corte (gm). Los datos siguientes* se generaron pa¬ 
ra ser consistentes con la información dada en el artículo: 


Observación 

Fuerza 

Potencia 

Temperatura 

Tiempo 

Resistencia 

1 

30 

60 

175 

15 

26.2 

2 

40 

60 

175 

15 

26.3 

3 

30 

90 

175 

15 

39.8 

4 

40 

90 

175 

15 

39.7 

5 

30 

60 

225 

15 

38.6 

6 

40 

60 

225 

15 

35.5 

7 

30 

90 

225 

15 

48.8 

8 

40 

90 

225 

15 

37.8 

9 

30 

60 

175 

25 

26.6 

10 

40 

60 

175 

25 

23.4 

11 

30 

90 

175 

25 

38.6 

12 

40 

90 

175 

25 

52.1 

13 

30 

60 

225 

25 

39.5 

14 

40 

60 

225 

25 

32.3 

15 

30 

90 

225 

25 

43.0 

16 

40 

90 

225 

25 

56.0 

17 

25 

75 

200 

20 

35.2 

18 

45 

75 

200 

20 

46.9 

19 

35 

45 

200 

20 

22.7 

20 

35 

105 

200 

20 

58.7 

21 

35 

75 

150 

20 

34.5 

22 

35 

75 

250 

20 

44.0 

23 

35 

75 

200 

10 

35.7 

24 

35 

75 

200 

30 

41.8 

25 

35 

75 

200 

20 

36.5 

26 

35 

75 

200 

20 

37.6 

27 

35 

75 

200 

20 

40.3 

28 

35 

75 

200 

20 

46.0 

29 

35 

75 

200 

20 

27.8 

30 

35 

75 

200 

20 

40.3 


Del libro Statistics Engineering Problem Solving, de Stephen Vardeman, una excelente exposición del área cu¬ 
bierta en este libro, aunque a un nivel un tanto más alto. 
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Un paquete computarizado de estadística dio los siguientes estimados de mínimos cuadrados: 

/3 0 = -37.48 ¿8,= 0.2117 /3 2 = 0.4983 & = 0.1297 j3 4 = 0.2583 

Entonces se estima que 0.1297 gm es el cambio promedio en resistencia asociado con un 
aumento de un grado en temperatura, cuando los otros predictores se mantienen fijos; los 
otros coeficientes estimados se interpretan de un modo semejante. 

La ecuación estimada de regresión es 

y = -37.48 + 0.2117*! + 0.4983x 2 + 0.1297x 3 + 0.2583x 4 

Una predicción puntual de resistencia que resulta de una fuerza de 35 gm, potencia de 75 mW, 
temperatura de 200° y tiempo de 20 ms es 

y = -37.48 + (0.2117)(35) + (0.4983)(75) + (0.1297X200) + (0.2583)(20) 

= 38.41 gm 

Esta también es una estimación puntual del valor medio de resistencia para los valores es¬ 
pecificados de fuerza, potencia, temperatura y tiempo. ■ 


ó - 2 y /? 2 

Al sustituir los valores de los predictores desde las observaciones sucesivas, en la ecua¬ 
ción para la regresión estimada, se tienen los valores pronosticados o ajustados y l? y 2 , ■ 
. . , y n . Por ejemplo, como los valores de los cuatro predictores para la última observación 
en el ejemplo 13.12 son 35, 75, 200 y 20, respectivamente, el correspondiente valor pronos¬ 
ticado esy 30 = 38.41. Los residuos son las diferencias y, — y,, . . . , y n — y n . El último resi¬ 
duo del ejemplo 13.12 es 40.3 — 38.41 = 1.89. Cuanto más cerca de 0 se encuentren 
los residuos, mejor será el trabajo que haga la ecuación estimada para predecir los valores y 
correspondientes a valores de los predictores de la muestra. 

Por lo que se refiere a regresión lineal simple y regresión con polinomios, la estima¬ 
ción de o 2 está basada en la suma de residuos al cuadrado: 


SCE = I(y’- - y/ = Ity - (/3 0 + /3,x 1; + ■ ■ ■ + /3^)] 2 

Una fórmula eficiente de cálculo para suma de los cuadrados del error (SCE) se emplea en 
casi todos los paquetes computarizados de estadística. Como se han estimado k + 1 pará¬ 
metros (/3 0 , j3¡, . . . , /3 a ), se pierden k + 1 grados de libertad, de modo que n — (k + 1) 
grados de libertad están asociados con una SCE, y 


SCE 


(k + 1) 


CME 


Con STC = Y,(y¡ ~ v) 2 , la proporción de variación total explicada por el modelo de regre¬ 
sión múltiple es R 2 = 1 — SCE/STC, el coeficiente de determinación múltiple. Al igual 
que en una regresión con polinomios, es frecuente que R 2 sea ajustada para el número de pa¬ 
rámetros del modelo por la fórmula 


Rl = [(n - 1 )R 2 - k]/[n - (k + 1)] 


La raíz cuadrada positiva del coeficiente de determinación múltiple se denomina coefi¬ 
ciente de correlación múltiple R. Se puede demostrar que R es el coeficiente de correla¬ 
ción muestral r entre las y¡ observadas y las y ; pronosticadas (es decir, usando x ; = y7 en 
la fórmula para r resulta r = R). 


Ejemplo 13.13 Unos investigadores llevaron a cabo un estudio para ver la forma en que diversas caracterís¬ 
ticas del concreto se ven afectadas por x x = % de piedra caliza en polvo y x 2 = proporción 
de agua y cemento; dicho estudio dio por resultado los datos que aparecen a continua¬ 
ción (“Durability of Concrete with Addition of Limestone Powder”, Magazine of Concrete 
Research, 1996; 131-137). 
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*1 

*2 

*1*2 

Resist. a la compr. de 28 días (MPa) 

Adsorción (%) 

21 

0.65 

13.65 

33.55 

8.42 

21 

0.55 

11.55 

47.55 

6.26 

7 

0.65 

4.55 

35.00 

6.74 

7 

0.55 

3.85 

35.90 

6.59 

28 

0.60 

16.80 

40.90 

7.28 

0 

0.60 

0.00 

39.10 

6.90 

14 

0.70 

9.80 

31.55 

10.80 

14 

0.50 

7.00 

48.00 

5.63 

14 

0.60 

8.40 

42.30 

7.43 




y = 39.317, STC = 278.52 

y = 7.339, STC = 18.356 


Considere primero la resistencia a la compresión como la variable dependiente y. El ajuste 
del modelo de primer orden da por resultado 

y = 84.82 + 0.1643xj - 79.67x 2 SCE = 72.25 (gl = 6) R 2 = 0.741 R\ = 0.654 
mientras que si se incluye un predictor de interacción dará 

y = 6.22 + 5.779*! + 51.33x 2 ~ 9.357*¡* 2 
SCE = 29.35 (gl = 5) R 2 = 0.895 R\ = 0.83Í 

Con base en este último ajuste, una predicción para la resistencia a la compresión cuando el 
porcentaje de piedra caliza es 14 y la proporción de agua y cemento = 0.60 es 

y = 6.22 + 5.779(14) + 51.33(0.60) - 9.357(8.4) = 39.32 

Un ajuste de toda la relación cuadrática da por resultado que prácticamente no hay cambio 
en el valor de R 2 . No obstante, cuando la variable dependiente es la adsorción, se obtienen 
los siguientes resultados: R 2 = 0.747 cuando se usan sólo dos pronosticadoras, 0.802 cuan¬ 
do se agrega el predictor de interacción, y 0.889 cuando se usan los cinco predictores pa¬ 
ra toda la relación cuadrática. ■ 

En general, /3¡ se puede interpretar como una estimación del cambio promedio en y 
asociado con un aumento de una unidad en x¡ mientras se mantengan fijos los valores de to¬ 
dos los otros predictores. A veces, sin embargo, es difícil y hasta imposible aumentar el va¬ 
lor de un predictor al tiempo que se mantienen fijos todos los otros. En situaciones como 
éstas, hay una interpretación alternativa de los coeficientes de regresión estimados. En sín¬ 
tesis, supóngase que k = 2, y se denota con /3j la estimación de /3 en la regresión de y en 
los dos predictores x¡ y x 2 . Entonces 


1. Haga regresión de y contra sólo x 2 (una regresión lineal simple) y denote por g x , g 2 , ..., 
g n los residuos resultantes. Estos residuos representan variación en y después de eliminar 
o ajustar los efectos de x 2 . 

2. Haga regresión de x x contra x 2 (esto es, considere x l como la variable independiente en 
esta regresión lineal simple), y denote los residuos por/j, . . . , f n . Estos residuos repre¬ 
sentan variación en x x después de eliminar o ajustar los efectos de x 2 . 

Ahora considere trazar los residuos de la primera regresión contra los de la segunda; esto 
es, dibuje los pares (/j, y,), . . . , (f n , g n ). El resultado se denomina gráfica parcial de re¬ 
siduos o gráfica ajustada de residuos. Si ha de ajustarse una recta de regresión a los pun¬ 
tos de esta gráfica, la pendiente resulta ser exactamente /3[ (además, los residuos de esta 
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recta son exactamente los residuos e¡, . . . , e n de la regresión múltiple de y en x l y x 2 ). En¬ 
tonces, /3j se puede interpretar como los cambios estimados en y asociados con un aumento 
de una unidad en jq después de eliminar o ajustar los efectos de cualesquier otros predicto- 
res del modelo. La misma interpretación se cumple para otros coeficientes estimados, cual¬ 
quiera que sea el número de predictores del modelo (no hay algo especial acerca de k = 2; 
el argumento anterior sigue válido si se hace regresión de y contra todos los predictores que 
no sean x¡ en el paso 1 y se hace regresión de jq contra los otros k — 1 predictores del pa¬ 
so 2). 

Como ejemplo, suponga que y es el precio de venta de un edificio de departamentos 
y que los predictores son números de departamento, antigüedad, tamaño de lote, número de 
espacios de estacionamiento y área total del edificio (pie 2 ). Puede no ser razonable 
aumentar el número de departamentos sin incrementar también el área total. No obstante, si 
/3 S = 16.00, entonces se puede decir que un aumento de $16 en el precio de venta está aso¬ 
ciado con cada pie cuadrado extra de área total, después de ajustar los efectos de los otros 
cuatro predictores. 

Una prueba de utilidad de modelo 

Con datos multivariados, no hay una representación preliminar análoga a una gráfica de pun¬ 
tos para indicar si un modelo particular de regresión múltiple se juzgará como útil. El valor de 
R 2 ciertamente comunica un mensaje preliminar, pero este valor es a veces engañoso porque 
puede estar fuertemente inflado si se usa un número grande de predictores (k grande) con res¬ 
pecto al tamaño muestral n (esta es la razón fundamental que hay detrás de ajustar R 2 ). 

La prueba de la utilidad de un modelo en regresión lineal simple comprendió la hipó¬ 
tesis nula H 0 : [3 , = 0, según la cual no hay relación útil entre y y el predictor individual x. 
Aquí se considera la afirmación de que ¡3 ¡ = 0, j8 2 = 0, . . . , ¡3 k = 0, que dice que no hay 
relación útil entre y y cualquiera de los k predictores. Si al menos una de estas [3 no es 0, 
el(los) predictor(es) correspondiente(s) es(son) útil(es). La prueba está basada en un esta¬ 
dístico que tiene una distribución F particular cuando H 0 es verdadera. 



Hipótesis nula: H 0 : ¡3 l = ¡3 2 = - ■ ■ = ¡3 k = 0 

Hipótesis alternativa: //,/. al menos una [3 I V 0 (i = \, ... ,k) 

R 2 /k 

Valor estadístico de prueba*: f= - (13.19) 

(1 - R 2 )/[n - (k + 1)] 

_ _ SCR ¡k _ _ RMC 

SCE/[n - (k + 1)] ~~ CME 

donde SCR = suma de cuadrados de regresión = STC - SCE 


Región de rechazo para una prueba de nivel a: f > F akn . (k ^ u 


Excepto para un múltiplo constante, el estadístico de prueba aquí es R 2 /{ 1 — R 2 ), que es la 
razón entre una variación explicada y una no explicada. Si la proporción de variación expli¬ 
cada es alta con respecto a la no explicada, naturalmente se rechazaría H 0 y se confirmaría la 
utilidad del modelo. No obstante, si k es grande con respecto a n, el factor [(n — (k + I )/k] 
reducirá considerablemente a/. 

Ejemplo 13.14 Volviendo a los datos de resistencia de pegamento al corte del ejemplo 13.12, se ajustó un 
modelo con k = 4 predictores, de manera que las hipótesis relevantes son 

H 0 : = /3 2 = /3 3 — /3 4 = 0 

H d : al menos una de estas cuatro ¡3 no es 0 
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La figura 13.15 muestra la generación impresa del paquete de estadística JMP. Los valores 
de s (error de raíz cuadrática media), R 2 y R 2 ajustada ciertamente sugieren un modelo útil. 
El valor de la razón F de utilidad del modelo es 

RVk _ 0.713959/4 

f ~ (1 - R 2 )/[n — (Jfc + 1)] ~~ 0.286041/(30 - 5) “ 15 ' 6 ° 

Este valor también aparece en la columna “F Ratio” de la tabla ANOVA de la figura 13.15. 
El máximo valor crítico F para grado de libertad de numerador 4 y denominador 25 en la 
tabla A.9 del apéndice es 6.49, que captura un área de cola superior de 0.001. De aquí el 
valor P < 0.001. La tabla ANOVA de la salida impresa del JMP muestra que el valor 
P < 0.0001. Este es un resultado muy significativo. La hipótesis nula debería ser rechaza¬ 
da a cualquier nivel razonable de significación. La conclusión es que hay una relación lineal 
útil entre y y al menos uno de los cuatro predictores del modelo. Esto no significa que los 
cuatro predictores sean útiles; un poco más adelante se tratará más de esto. 


Response: strength 


(Summary of Fit) 


RSquare 

0.713959 

RSquare Adj 

0.668193 

Root Mean Square Error 

5,157979 

Mean of Response 

38.40667 

Observations (or Sum Wgts) 

30 


(Parameter Estimates ) 




Term 

Estímate 

Std Error 

t Ratio 

Prob>|t| 

Intercept 

-37.47667 

13.09964 

-2.86 

0.0084 

forcé 

0.2116667 

0.210574 

1.01 

0.3244 

power 

0.4983333 

0.070191 

7.10 

<.0001 

temp 

0.1296667 

0.042115 

3.08 

0.0050 

time 

0.2583333 

0.210574 

1.23 

0.2313 


(Whole-Model Test") 
(Analysis of Variance ) 


Source 

DF 

Sum of Squares 

Mean Square 

F Ratio 

Model 

4 

1660.1400 

415.035 

15.6000 

Error 

25 

665.1187 

26.605 

Prob>F 

C Total 

29 

2325.2587 


<.0001 


-■ i- ■ ■ —. V 


Figura 13.15 Salida de regresión múltiple del JMP para los datos del ejemplo 13.14. ■ 


Inferencias en regresión múltiple 

Antes de construir hipótesis y los IC y hacer predicciones, uno debería primeramente exa¬ 
minar gráficas de diagnóstico para ver si el modelo necesita modificación o si hay valores 
aislados en los datos. Las gráficas recomendadas son residuos (estandarizados) en función 
de cada variable independiente, residuos en función de v, y en función de y, y una gráfica de 
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probabilidad normal de los residuos estandarizados. Los problemas potenciales están suge¬ 
ridos por los mismos patrones estudiados en la sección 13.1. De particular importancia es la 
identificación de observaciones que tengan una gran influencia en el ajuste. En la sección 
siguiente, se describen varias herramientas de diagnóstico apropiadas para este trabajo. 

Debido a que cada j8, es una función lineal de las y¡, la desviación estándar de cada /3, 
es el producto de cr y una función de las x¡j, de modo que se obtiene una estimación Sf¡. al 
sustituir s con cr. La función de las x¡j es bastante complicada, pero todos los paquetes compu- 
tarizados estándar de regresión calculan y muestran las .vy,. Las inferencias respecto a una 
sola /3, están basadas en la variable estandarizada 


que tiene una distribución t con n — (k + 1) grados de libertad. 

La estimación puntual de p, Y , x , x *, el valor esperado de Y cuando x¡ = x *,... , x k = 
x*, es (i y . x í x * = /3o + /3[jc* + • • • + (i k x*. La desviación estándar estimada del estima¬ 
dor correspondiente es de nuevo una expresión complicada que comprende la muestra de las 
x¡j. No obstante, los mejores paquetes de estadística computarizados la calcularán cuando se 
les indique. Las inferencias alrededor de p, y . t * x , están basadas en estandarizar su esti¬ 
mador para obtener una variable t que tenga n — (k + 1) grados de libertad. 



1. Un intervalo de confianza 100(1 — a)% para j8 ; , el coeficiente de x¡ en la función 
de regresión, es 

Pi — t al2,n-(k+\) ' S fíi 

2. Una prueba para H 0 : ¡3¡ = /3 ;o utiliza el valor estadístico t de t = (J3 I ■ — ¡3 ;o )/^, basa¬ 
do en n — (k + 1) grados de libertad. La prueba es de cola superior, cola inferior, 
o de dos colas, según si // a contiene la desigualdad >,<of. 

3. Un intervalo de confianza 100(1 — a)% para i± Y . x * es 
¡x Y . x * ± í„/ 2 , n -ft+i) ‘ {desviación estándar estimada de ¡1 Y . X * 

= Y — t a/2,n-(k+l) ' S f 

donde Y es el estadístico /3 0 + 0 ¡x* +■■■ + ¡8 k x* y y es el valor calculado de Y. 

4. Un intervalo de confianza 100(1 — a)% para un valor futuro de y es 

Ar-xt, • ■ .,xí ± • i* 2 + (desviación estándar estimada de (l Y . x * J) 2 } m 

= y — 4/2,n-(t+1) ’ Vi 2 + í| 

Los intervalos simultáneos, para los que la confianza simultánea o nivel de predic¬ 
ción es controlado, se pueden obtener al aplicar la técnica de Bonferroni. 



Ejemplo 13.15 La adsorción de suelo y sedimento, la magnitud a la que se recolectan productos químicos 
en forma condensada en la superficie, es una importante característica que influye sobre la 
efectividad de plaguicidas y diversos productos químicos agrícolas. El artículo “Adsorption 
of Phosphate, Arsenate, Methanearsonate, and Cacodylate by Lake and Stream Sediments: 
Comparisons with Soils” ( J. ofEnviron. Qiial., 1984: 499-504) da la información siguiente 
(tabla 13.5) en y = índice de adsorción de fosfato, x, = cantidad de hierro extraíble y x 2 = 
cantidad de aluminio extraíble. 
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Tabla 13.5 Datos para el ejemplo 13.15 


Observación 

x i = 

Hierro 

extraíble 

*2 = 

Aluminio 

extraíble 

y = 

índice de 
adsorción 

1 

61 

13 

4 

2 

175 

21 

18 

3 

111 

24 

14 

4 

124 

23 

18 

5 

130 

64 

26 

6 

173 

38 

26 

7 

169 

33 

21 

8 

169 

61 

30 

9 

160 

39 

28 

10 

244 

71 

36 

11 

257 

112 

65 

12 

333 

88 

62 

13 

199 

54 

40 


El artículo propuso el modelo 


Y = /3 0 + + /3 2 x 2 + e 

Un análisis de computadora dio la información siguiente: 



Parámetro /3, 

Estimación p : 

DE .Vp estimada 

J3 0 

-7.351 

3.485 

Pi 

0.11273 

0.02969 

& 

0.34900 

0.07131 

R 2 = 0.948 

R 2 ajustada = 0.938 i 

= 4.379 

Ay-160,39 ~y ~ 

-7.351 + (0.11273)(160) + (0.34900)(39) = 24.30 

DE estimada de fi Y . 160i39 = s Y = 1.30 




Un intervalo de confianza de 99% para j8,, el cambio en adsorción esperada asociado con 
un aumento de una unidad en hierro extraíble mientras el aluminio extraíble se mantiene fijo, 
requiere í 0005 13 _ (2+1) = t 0005 10 = 3.169. El intervalo de confianza es 

0.11273 ± (3.169)(0.02969) = 0.11273 ± 0.09409 « (0.019, 0.207) 

De modo semejante, un intervalo de 99% para /3 2 es 

0.34900 ± (3.169)(0.07131) = 0.34900 ± 0.22598 « (0.123, 0.575) 

La técnica de Bonferroni implica que el nivel de confianza simultáneo para ambos interva¬ 
los es al menos de 98%. 

Un intervalo de confianza de 95% para /x 7 . 160 V:) , la adsorción esperada cuando el hie¬ 
rro extraíble = 160 y el aluminio extraíble = 39, es 

24.30 ± (2.228X1.30) = 24.30 ± 2.90 = (21.40, 27.20) 

Un intervalo de predicción de 95% para un valor futuro de adsorción a observar cuando 
X, = 160 y x 2 = 39 es 

24.30 ± (2.228){(4.379) 2 + (1.30) 2 } 1/2 = 24.30 ± 10.18 = (14.12, 34.48) 

Es frecuente que la hipótesis de interés tenga la forma H 0 : [3/ = 0 para una i particu¬ 
lar. Por ejemplo, después de ajustar el modelo de cuatro pronosticadoras del ejemplo 13.12, 
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el investigador podría desear probar H 0 : /3 4 = 0. Según H 0 , mientras los predictores x¡, x 2 y 
x 3 continúen en el modelo, x 4 no contiene información útil acerca de y. El valor del estadís¬ 
tico de prueba es la razón t $/Sp, Numerosos paquetes computarizados de estadística pre¬ 
sentan la razón t y el correspondiente valor P para cada uno de los predictores incluidos en 
el modelo. Por ejemplo, la figura 13.15 muestra que mientras la potencia, temperatura y 
tiempo se retengan en el modelo, el predictor x t = fuerza se puede eliminar. 

Una prueba F para un grupo de predictores La prueba de utilidad F del modelo era 
apropiada para probar si hay información útil acerca de la variable dependiente en cual¬ 
quiera de los k predictores (es decir, si ¡3¡ = ■ ■ ■ = ¡3 k = 0). En muchas situaciones, uno 
construye primero un modelo que contenga k predictores y luego desea saber si cualquie¬ 
ra de los predictores de un subconjunto particular da información útil acerca de Y. Por 
ejemplo, un modelo a usar para predecir calificaciones de examen de estudiantes podría in¬ 
cluir un grupo de variables secundarias, como son ingreso familiar y niveles de educación, 
y también algunas variables escolares características como el tamaño del grupo y gasto por 
alumno. Una hipótesis interesante es que los predictores escolares característicos pueden 
omitirse del modelo. 

Los predictores se marcan como x¡, x 2 , . . . , x¡, x l+l , . . . , x k , de modo que sea la últi¬ 
ma k — l que se están considerando omitir del modelo. Entonces se desea probar 



H 0 - Í3 ¡+1 ¡3 1+2 ' ¡3 k 0 

(de modo que el modelo “reducido” Y = f3 0 + fi¡x { + • • • + /3pc, + e es correcto) 
contra 

H d : al menos una entre /3 /+1 , . . . , ¡3 k no es 0 

(de modo que en el modelo “completo” Y = ¡3 0 + ¡3 l x l + ■■■ + [3 t x k + e, al 
menos uno de los últimos k — l predictores proporciona información útil) 



La prueba se realiza al ajustar tanto el modelo completo como el reducido. Debido a que el 
modelo completo contiene no sólo los predictores del modelo reducido sino también algu¬ 
nos predictores adicionales, debe ajustar los datos al menos tan bien como el modelo reduci¬ 
do. Esto es, si se hace que SCL Í; sea la suma de residuos al cuadrado para el modelo 
completo y SCE, sea la suma correspondiente para el modelo reducido, entonces SCE,. < 
SCE,.* Intuitivamente, si SCE,. es mucho mayor que SCE ; , el modelo completo da un ajus¬ 
te mucho mejor que el modelo reducido; el estadístico de prueba apropiado debe depender 
entonces de la reducción SCE, — SCE,. en variación inexplicada. El procedimiento formal es 


SCE,. = variación inexplicada para el modelo completo 
SCE, = variación inexplicada para el modelo reducido 

(SCE, - SCE k )/(k - l) 

Valor de estadístico de prueba: f = --—— , 

SCEj/[n — (k + 1)] 

Región de rechazo: /> F ak _ ln _^ k+1) 


(13.20) 


* En general, las estimaciones j3 0 , /3j,..., /3 Z serán diferentes para los modelos completo y reducido, de modo que, 
también en general, deben ejecutarse dos regresiones múltiples diferentes para obtener SCE Z y SCE k . No obstan¬ 
te, si las variables aparecen en el orden sugerido, casi todos los paquetes de software dan una tabla ANOVA de 
“sumas secuenciales de cuadrados”, para el modelo completo, que se pueden usar para evitar ajustar el modelo 
reducido. 
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e 



13.4 Análisis de regresión múltiple 541 

La información de la tabla 13.6 se tomó del artículo “Applying Stepwise Múltiple Regres- 
sion Analysis to the Reaction of Formaldehyde with Cotton Cellulose” (Textile Research J., 
1984: 157-165). La variable dependiente y es una capacidad durable de planchado, una me¬ 
dida cuantitativa de resistencia a las arrugas. Las cuatro variables independientes empleadas 
en el proceso de construcción del modelo son jt¡ = concentración de HCHO (formaldehí- 
do), x 2 = razón de catalizador, x 3 = temperatura de curado yr 4 = tiempo de curado. 


Tabla 13.6 Datos para el ejemplo 13.16 


Observación 

*i 

*2 

*3 

x 4 


Observación 

*i 

*2 

*3 

*4 

J 

1 

8 

4 

100 

1 

1.4 

16 

4 

10 

160 

5 

4.6 

2 

2 

4 

180 

7 

2.2 

17 

4 

13 

100 

7 

4.3 

3 

7 

4 

180 

1 

4.6 

18 

10 

10 

120 

7 

4.9 

4 

10 

7 

120 

5 

4.9 

19 

5 

4 

100 

1 

1.7 

5 

7 

4 

180 

5 

4.6 

20 

8 

13 

140 

1 

4.6 

6 

7 

7 

180 

1 

4.7 

21 

10 

1 

180 

1 

2.6 

7 

7 

13 

140 

1 

4.6 

22 

2 

13 

140 

1 

3.1 

8 

5 

4 

160 

7 

4.5 

23 

6 

13 

180 

7 

4.7 

9 

4 

7 

140 

3 

4.8 

24 

7 

1 

120 

7 

2.5 

10 

5 

1 

100 

7 

1.4 

25 

5 

13 

140 

1 

4.5 

11 

8 

10 

140 

3 

4.7 

26 

8 

1 

160 

7 

2.1 

12 

2 

4 

100 

3 

1.6 

27 

4 

1 

180 

7 

1.8 

13 

4 

10 

180 

3 

4.5 

28 

6 

1 

160 

1 

1.5 

14 

6 

7 

120 

7 

4.7 

29 

4 

1 

100 

1 

1.3 

15 

10 

13 

180 

3 

4.8 

30 

7 

10 

100 

7 

4.6 


Considere el modelo completo formado por k = 14 predictores: x,, x 2 , x 3 , x 4 , x 5 = x], 
. . . , x 8 = x 4 , x 9 = XjX 2 , . . . , x 14 = x 3 x 4 (todos los predictores de primero y 
segundo órdenes). ¿Se justifica la inclusión de predictores de segundo orden? Esto es, ¿de¬ 
be usarse el modelo reducido formado sólo por los predictores x,, x 2 , x 3 y x 4 (/ = 4)? A con¬ 
tinuación se presenta la salida que resulta de ajustar los dos modelos: 


O 


Parámetro 

Estimación para 
modelo reducido 

Estimación para 
modelo completo 

0o 

-0.9122 

-8.807 

í¡i 

0.16073 

0.1768 

02 

0.21978 

0.7580 

03 

0.011226 

0.10400 

04 

0.10197 

0.5052 

05 

— 

-0.04393 

06 

— 

-0.035887 

07 

— 

-0.00003271 

08 

— 

-0.01646 

09 

— 

0.00588 

010 

— 

0.002702 

011 

— 

0.01178 

012 

— 

-0.0006547 

013 

— 

0.00242 

014 

— 

0.002526 

R 2 

0.692 

0.921 

SCE 

17.4951 

4.4782 
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Las hipótesis a probar son 

H 0 : P 5 = P 6 = ■ ■ ■ = P 14 = 0 
en función de 

H¿. al menos una entre p s , . . . , p u no es 0 

Con k = 14 y / = 4, el valor crítico de F para una prueba a = 0.01 es F 0011015 = 3.80. El 
valor del estadístico de prueba es 

(17.4951 - 4.4782)/10 1.3017 

f= - --- = - = 4.36 

J 4.4782/15 0.2985 

Como 4.36 & 3.80, H 0 es rechazada. La conclusión es que el modelo apropiado debe incluir 
al menos uno de los predictores de segundo orden. ■ 

Evaluación de la adecuación del modelo 

Los residuos estandarizados en regresión múltiple resultan de dividir cada uno de los resi¬ 
duos entre su desviación estándar estimada; la fórmula para estas desviaciones estándar es 
considerablemente más complicada que en el caso de regresión lineal simple. Se recomien¬ 
da una gráfica de probabilidad normal de los residuos estandarizados como base para vali¬ 
dar la suposición de normalidad. Las gráficas de residuos estandarizados en función 
de cada predictor y en función de v no deberían mostrar un patrón discernible. Las gráfi¬ 
cas de residuos ajustadas también pueden ser útiles en este trabajo. El libro de Neter y otros 
es una referencia sumamente útil. 

Ejemplo 13.17 La figura 13.16 muestra una gráfica de probabilidad normal de los residuos estandarizados 
para los datos de adsorción y el modelo ajustado dado en el ejemplo 13.15. La rectitud de 
la gráfica arroja poca duda sobre la suposición de que la desviación aleatoria e está normal¬ 
mente distribuida. 



Residuo estandarizado 



Percentil z 


Figura 13.16 Una gráfica de probabilidad normal de los residuos estandarizados para los datos 
y modelo del ejemplo 13.15. 


La figura 13.17 muestra las otras gráficas sugeridas para los datos de adsorción. Dado 
que hay sólo 13 observaciones en el conjunto de datos, no hay mucha evidencia de un pa¬ 
trón en ninguna de las tres primeras gráficas que no sea la irregularidad. El punto situado en 
la parte inferior de cada una de estas tres gráficas corresponde a la observación con el resi¬ 
duo grande. Un poco más adelante se dirá más acerca de estas observaciones. Por ahora, no 
hay razón obligatoria para tomar una acción correctiva. 
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Residuo estandarizado 



Hierro 
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Residuo estandarizado 



Aluminio 


a) 


b) 


Residuo estandarizado 



y pronosticada 


y pronosticada 



Adsorción 


c) 


d) 


Figura 13.17 Gráficas de diagnóstico para los datos de adsorción: a) residuos estandarizados en función 
de x,; b) residuos estandarizados en función de x 2 ; c) residuos estandarizados en función dey; d) y en fun¬ 
ción de y. ■ 


O 


EJERCICIOS Sección 13.4 (36-54) 


36. La salud cardiorrespiratoria es ampliamente reconocida co¬ 
mo un componente importante del bienestar físico general. 
La medición directa de la inhalación máxima de oxígeno 
(V0 2 máx) es la mejor medida individual de esta salud, pe¬ 
ro la medición directa es lenta y costosa. Por tanto, es de¬ 
seable tener una ecuación de predicción para el VO, máx en 
términos de cantidades que se puedan obtener con facilidad. 
Considere las variables 

y = VO-, máx (1/min) x¡ = peso (kg) 
x 2 = edad (años) 

x 3 = tiempo necesario para caminar 1 milla (min) 

x 4 = ritmo cardiaco el final de la caminata (pulsaciones/min) 

He aquí un posible modelo, para estudiantes de sexo mascu¬ 
lino, consistente con la información dada en el artículo 
“Validation of the Rockport Fitness Walking Test in Colle- 
ge Males and Females” (Research Quarterly for Exercise 
and Sport, 1994: 152-158): 

Y = 5.0 + O.Ol.Yj - 0.05x2 - 0.1 3x 3 - 0.01x 4 + e 
o- = 0.4 

a. Interprete f3 1 y /S 3 . 


b. ¿Cuál es el valor esperado de V0 2 máx cuando el peso 
es de 76 kg, 20 años de edad, el tiempo de caminata es 
de 12 minutos y el ritmo cardiaco es de 140 p/min? 

c. ¿Cuál es la probabilidad de que V0 2 máx sea entre 1.00 
y 2.60 para una sola observación hecha cuando los va¬ 
lores de los predictores son como se expresa en el in¬ 
ciso b)? 

37. Una compañía de transporte por carretera consideró un mo¬ 
delo de regresión múltiple, para relacionar la variable de¬ 
pendiente v = tiempo total de viaje diario para uno de sus 
conductores (horas), con los predictores x¡ = distancia re¬ 
corrida (millas) y x 2 = número de entregas hechas. Supón¬ 
gase que la ecuación del modelo es 

Y — -0.800 + 0.060-V| + 0.900x 2 + e 

a. ¿Cuál es el valor medio de tiempo de viaje cuando la dis¬ 
tancia recorrida es de 50 millas y se hacen tres entregas? 

b. ¿Cómo se interpretaría j8j = 0.060, el coeficiente del 
predictor x 3 ? ¿Cuál es la interpretación de fi 2 = 
0.900? 

c. Si <x = 0.5 horas, ¿cuál es la probabilidad de que el tiem¬ 
po de viaje sea a lo sumo de 6 horas cuando se hacen tres 
entregas y la distancia recorrida sea de 50 millas? 
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38. Sea y = duración de un cojinete, x¡ = viscosidad de aceite, 
y x 2 = carga. Supóngase que el modelo de regresión múlti¬ 
ple que relaciona duración con viscosidad y carga es 

Y = 125.0 + 1.15x 1 + 0.0950jc 2 - 0.0090*i* 2 + e 

a. ¿Cuál es el valor medio de la duración cuando la visco¬ 
sidad es 40 y la carga es 1100? 

b. Cuando la viscosidad es de 30, ¿cuál es el cambio en la du¬ 
ración media asociado con un aumento de uno en carga? 
Cuando la viscosidad es de 40, ¿cuál es el cambio en la du¬ 
ración media asociado con un incremento de uno en carga? 

39. Sea y = ventas de un restaurante de comida rápida (miles 
de dólares), x¡ = número de restaurantes competidores a 
una milla a la redonda, x 2 = población dentro de una milla 
de radio (miles de personas) y * 3 es una variable indicadora 
igual a uno si el restaurante tiene una ventanilla para auto¬ 
movilistas y 0 si no la tiene. Suponga que el modelo de re¬ 
gresión verdadero es 

Y — 10.00 — 1.2*! + 6.8*, + 15.3*3 + e 

a. ¿Cuál es el valor medio de ventas cuando el número de 
restaurantes competidores es dos, hay 8000 habitantes 
en un radio de una milla, y el restaurante tiene una ven¬ 
tanilla para automovilistas? 

b. ¿Cuál es el valor medio de ventas de un restaurante sin 
ventanilla para automovilistas, que tiene tres restaurantes 
competidores y 5000 habitantes en un radio de una milla? 

c. Interprete /3 3 . 

40. El artículo “Readability of Liquid Crystal Displays: A Res- 
ponse Surface” (Human Factors, 1983: 185-190) utilizó un 
modelo de regresión múltiple con cuatro variables indepen¬ 
dientes para estudiar la precisión en nitidez de pantallas de 
cristal líquido. Las variables fueron 

y = porcentaje de error de cuatro dígitos para sujetos que 
ven una pantalla de cristal líquido 
*! = nivel de luz de fondo (de 0 a 122 cd/m 2 ) 

* 2 = cuerda subtendida de carácter (de 0.025° a 1.34°) 

* 3 = ángulo de visión (de 0° a 60°) 

* 4 = nivel de luz ambiental (de 20 a 1500 lux) 

El ajuste del modelo a los datos fue Y = j3 0 + f) 1 x 1 + 
(3 2 x 2 + (83*3 + (84*4 + e. Los coeficientes estimados resul¬ 
tantes fueron /3 0 = 1.52, = 0.02, 0 2 = -1.40, j8 3 = 0.02 

y 0 4 = -0.0006. 

a. Calcule una estimación de porcentaje de error esperado 
cuando *j = 10, * 2 = 0.5, * 3 = 50 y * 4 = 100. 

b. Estime el porcentaje de error medio asociado con un nivel 
de luz de fondo de 20, cuerda subtendida de carácter de 
0.5, ángulo de visión de 10 y nivel de luz ambiental de 30. 

c. ¿Cuál es el cambio esperado y estimado en error porcen¬ 
tual, cuando el nivel de luz ambiental se aumenta en una 
unidad mientras que todas las otras variables se mantienen 
fijas en los valores dados en el inciso a)? Conteste para un 
aumento de 100 unidades en nivel de luz ambiental. 

d. Explique por qué las respuestas del inciso c) no depen¬ 
den de los valores fijos de * l5 * 2 y * 3 . ¿Bajo qué condi¬ 
ciones habría tal dependencia? 

e. El modelo estimado se basó en n = 30 observaciones, 
con STC = 39.2 y SCE = 20.0. Calcule e interprete el 


coeficiente de determinación múltiple, y luego realice la 
prueba de utilidad del modelo usando a = 0.05. 

41. La capacidad de ecologistas para identificar regiones de má¬ 
xima riqueza de especies podría tener un impacto en la preser¬ 
vación de la diversidad genética, que es una meta importante 
de la Estrategia Mundial de Conservación. El artículo “Pre- 
diction of Rarities from Habitat Variables: Coastal Plain 
Plants on Nova Scotian Lakeshores” ( Ecology , 1992: 1852- 
1859) utilizó una muestra de n = 37 lagos para obtener la 
ecuación estimada de regresión 

y = 3.89 + 0.033*! + 0.024* 2 + 0.023* 3 

— 0.0080* 4 — 0.13* 5 — 0.72* 6 

donde y = riqueza de especies, x¡ = área de cuenca de cap¬ 
tación de aguas, * 2 = anchura de la orilla, * 3 = drenaje de¬ 
ficiente (%), * 4 = color del agua (total de unidades de 
color), * 5 = arena (%) y x 6 — alcalinidad. El coeficiente 
de determinación múltiple se informó como R 2 = 0.83. 
Realice una prueba de utilidad de modelo. 

42. Una investigación de un proceso de fundición a presión pro¬ 
dujo los datos siguientes sobre x¡ — temperatura de horno, 
*2 = tiempo de cierre de matriz y y = diferencia en tempe¬ 
ratura en la superficie de la matriz (”A Multiple-Objective 
Decision-Making Approach for Assessing Simultaneous 
Improvement in Die Life and Casting Quality in a Die Cas- 
ting Process”, Quality Engineering, 1994: 371-383). 


*1 

1250 

1300 

1350 

1250 

1300 

*2 

6 

7 

6 

7 

6 

y 

80 

95 

101 

85 

92 


*1 

1250 

1300 

1350 

1350 

*2 

8 

8 

7 

8 

y 

87 

96 

106 

108 


A continuación aparece la salida de MINITAB por ajuste 
del modelo de regresión múltiple con pronosticadoras x¡ 


y x 2 . 

The regression equation is 
tempdiff =-200 + 0.210 furntemp 



+ 3.00 clostime 



Predictor 

Coef 

Stdev t- 

-ratio 

p 

Constant 

-199.56 

11.64 

-17.14 

0.000 

furntemp 0 

.210000 0. 

008642 

24.30 

0.000 

clostime 

3.0000 

0.4321 

6.94 

0.000 

s = 1.058 

R-sq =99.1% 

R-sq(adj) = 98 

.8% 

Analysis of 

Variance 




SOURCE 

DF SS 

MS 

F 

P 

Regression 

2 715.50 

357.75 

319.31 

0.000 

Error 

6 6.72 

1.12 



Total 

8 722.22 





a. Efectúe la prueba de utilidad del modelo. 

b. Calcule e interprete un intervalo de confianza de 95% 
para /3 2 , el coeficiente de regresión de población de * 2 . 
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c. Cuando x¡ = 1300 y x 2 = 7, la desviación estándar esti¬ 
mada de y es Sf. = 0.353. Calcule un intervalo de con¬ 
fianza de 95% para una verdadera diferencia promedio 
de temperatura, cuando la temperatura del homo sea de 
1300 y el tiempo de cierre de matriz es de siete. 

d. Calcule un intervalo de predicción de 95% para la dife¬ 
rencia de temperatura que resulte de un ciclo individual 
y experimental de fundición, con temperatura del horno 
de 1300 y tiempo de cierre de matriz de siete. 

43. Un experimento realizado para estudiar el efecto del conte¬ 
nido molar del cobalto (x,) y la temperatura de calcinación 
(x 2 ) en el área superficial de un catalizador de hidróxido de 
hierro-cobalto (y), produjo los datos siguientes (“Structural 
Changes and Surface Properties of Co x Fe 3 _ x 0 4 Spinels”, 
J. of Chemical Tech. And Biotech., 1994: 161-170). Una pe¬ 
tición al paquete SAS para ajustar j8 0 + fi l x l + j8,x 2 + 
/3 3 x 3 , donde x 3 = x l x 2 (una pronosticadora de interacción), 
generó lo siguiente. 


*1 

0.6 

0.6 

0.6 

0.6 

0.6 

1.0 

1.0 

x 2 

200 

250 

400 

500 

600 

200 

250 

y 

90.6 

82.7 

58.7 

43.2 

25.0 

127.1 

112.3 

Xí 

1.0 

1.0 

1.0 

2.6 

2.6 

2.6 

2.6 

x 2 

400 

500 

600 

200 

250 

400 

500 

y 

19.6 

17.8 

9.1 

53.1 

52.0 

43.4 

42.4 

X¡ 

2.6 

2.8 

2.8 

2.8 

2.8 

2.8 


x 2 

600 

200 

250 

400 

500 

600 


y 

31.6 

40.9 

37.9 

27.5 

27.3 

19.0 
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a. Pronostique el valor del área superficial cuando el con¬ 
tenido de cobalto sea de 2.6 y la temperatura sea de 250, 
y calcule el valor del residuo correspondiente. 

b. Debido a que jS¡ = -46.0, es legítimo concluir que si el 
contenido de cobalto aumenta en una unidad mientras 
sigan fijos los valores de los otros predictores, ¿puede 
esperarse que el área superficial se reduzca en alrededor 
de 46 unidades? Explique su razonamiento. 

c. ¿Parece haber una útil relación lineal entre y y los pre¬ 
dictores? 

d. Dado que el contenido de moles y temperatura de calci¬ 
nación permanecen en el modelo, ¿la interacción entre 
el predictor jc 3 da información útil acerca de v? Exprese 
y pruebe las hipótesis apropiadas usando un nivel de sig¬ 
nificación de 0.01. 

e. La desviación estándar estimada de Y, cuando el conte¬ 
nido de moles es de 2.0 y la temperatura de calcinación 
es 500, es Sf = 4.69. Calcule un intervalo de confianza 
de 95% para el valor medio del área superficial bajo es¬ 
tas circunstancias. 

44. Los autores del artículo “An Ultracentrifuge Flour Absorp- 
tion Method” (Cereal Chemistry, 1978: 96-101) estudiaron 
la relación entre la absorción de agua para harina de trigo y 
diversas características de la harina. En particular, los auto¬ 
res emplearon un modelo de regresión lineal múltiple de 
primer orden para relacionar la absorción y (%) con la pro¬ 
teína de harina x 1 (%) y daño al almidón x 2 (unidades Fa- 
rrand). Los datos y su salida SPSS aparecen en la página 
siguiente: 


Salida SAS para el ejercicio 43 

Dependent Variable: SURFAREA 




Analysis of 

Variance 



Source 

DF 

Sum of Squares 

Mean Square 

F Valué 

Prob>F 

Model 

3 

15223.52829 

5074.50943 

18.924 

0.0001 

Error 

16 

4290.53971 

268.15873 



C Total 

19 

19514.06800 





Root MSE 

16.37555 

R-square 

0.7801 

Dep Mean 

48.06000 

Adj R-sq 

0.7389 

C.V. 

34.07314 




Parameter Estimates 




Parameter 

Standard 

T for H0: 

Prob 

Variable 

DF 

Estímate 

Error 

Parameter=0 

> 1 T | 

INTERCEP 

1 

185.485740 

21.19747682 

8.750 

0.0001 

COBCON 

1 

-45.969466 

10.61201173 

-4.332 

0.0005 

TEMP 

1 

-0.301503 

0.05074421 

-5.942 

0.0001 

CONTEMP 

1 

0.088801 

0.02540388 

3.496 

0.0030 
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*1 

*2 

y 


*2 

y 

8.5 

2 

30.9 

12.9 

24 

47.0 

8.9 

3 

32.7 

12.0 

25 

46.8 

10.6 

3 

36.7 

12.9 

28 

45.9 

10.2 

20 

41.9 

13.1 

28 

48.8 

9.8 

22 

40.9 

11.4 

32 

46.2 

10.8 

20 

42.9 

13.2 

28 

47.8 

11.6 

31 

46.3 

11.6 

35 

49.2 

12.0 

32 

47.6 

12.1 

34 

48.3 

12.5 

31 

47.2 

11.3 

35 

48.6 

10.9 

28 

44.0 

11.1 

40 

50.2 

12.2 

36 

47.7 

11.5 

45 

49.6 

11.9 

28 

43.9 

11.6 

50 

53.2 

11.3 

30 

46.8 

11.7 

55 

54.3 

13.0 

27 

46.2 

11.7 

57 

55.8 


a. Interprete y 0 2 . 

b. ¿Qué proporción de variación observada en absorción 
puede ser explicada por la relación del modelo? 

c. ¿El modelo seleccionado parece especificar una relación 
lineal útil entre absorción y al menos uno de los dos pre- 
dictores? 

d. Si la proteína de harina continúa en el modelo, ¿se jus¬ 
tifica la eliminación del daño al almidón del predictor? 

e. Cuando x¡ = 10 y x 2 = 25, y = 42.253 y sy = 0.350. 
Calcule e interprete un intervalo de confianza y un inter¬ 
valo de predicción. 

f. La inclusión de un predictor de interacción da 0 3 = 
-0.04304 y sg 3 = 0.01773. Al nivel de significación 
0.01, ¿debe retenerse este predictor? 

45. El artículo “Analysis of the Modeling Methodologies for 
Predicting the Strength of Air-Iet Spun Yams” ( Textile Res. 
J„ 1997: 39-44) presentado en un estudio llevado a cabo pa¬ 
ra relacionar la tenacidad del hilo (y, en g/tex) con la canti¬ 
dad de hilo (Xj, en tex), porcentaje de poliéster (x 2 ), presión 
de la primera tobera (x 3 , en kg/cm 2 ) y presión de la segun¬ 
da tobera (x 4 , en kg/cm 2 ). La estimación del término cons¬ 
tante en la correspondiente ecuación de regresión múltiple 
fue de 6.121. Los coeficientes estimados para los cuatro 
predictores fueron —0.082, 0.113, 0.256 y —0.219, res- 

Salida SPSS para el ejercicio 44 

Múltiple R .98207 

R Square .96447 

Adjusted R Square .96163 

Standard Error 1.09412 


pectivamente, y el coeficiente de determinación múltiple 
fue de 0.946. 

a. Suponiendo que el tamaño muestral fue de n = 25, ex¬ 
prese y pruebe las hipótesis apropiadas para determinar 
si el modelo especifica una relación lineal útil entre la 
variable dependiente y al menos uno de los cuatro pre¬ 
dictores del modelo. 

b. Una vez más utilizando n = 25, calcule el valor de la R 2 
ajustada. 

c. Calcule un intervalo de confianza de 99% para una ver¬ 
dadera tenacidad media del hilo cuando la cantidad de 
éste es 16.5, el hilo contiene 50% de poliéster, la presión 
de la primera tobera es 3 y la presión de la segunda to¬ 
bera es 5, si la desviación estándar estimada de tenaci¬ 
dad bajo estas circunstancias es de 0.350. 

46. Un análisis de regresión efectuado para relacionar y = 
tiempo de reparación para un sistema de filtración de agua 
(h), con x¡ = tiempo transcurrido desde el servicio previo 
(meses) y x 2 — tipo de reparación (1 si es eléctrico y 0 si es 
mecánico), dio el siguiente modelo basado en n = 12 obser¬ 
vaciones: y = 0.950 + 0.400.*! + 1.250x 2 . Además, STC = 
12.72, SCE = 2.09, y íp 2 = 0.312. 

a. ¿Parece haber una relación lineal útil entre el tiempo de 
reparación y los dos predictores del modelo? Realice 
una prueba de las hipótesis apropiadas usando un nivel 
de significación de 0.05. 

b. Dado que el tiempo transcurrido desde el último servi¬ 
cio sigue en el modelo, ¿el tipo de reparación da infor¬ 
mación útil acerca del tiempo de reparación? Exprese y 
pruebe las hipótesis apropiadas usando un nivel de sig¬ 
nificación de 0 . 01 . 

c. Calcule e interprete un intervalo de confianza de 95% 
para f} 2 . 

d. La desviación estándar estimada de una predicción para 
el tiempo de reparación, cuando el tiempo transcurrido 
sea de 6 meses y la reparación es eléctrica, es de 0.192. 
Pronostique el tiempo de reparación bajo estas circuns¬ 
tancias al calcular un intervalo de predicción de 99%. 
¿El intervalo sugiere que el modelo estimado dará una 
predicción precisa? ¿Por qué sí o por qué no? 

47. El diseño eficiente de ciertos tipos de incineradores de 
desechos municipales exige que se disponga de información 


Analysis of 

Variance 



DF 

Sum of Squares 

Mean Square 

Regression 

2 

812.37959 

406.18980 

Residual 

25 

29.92755 

1.19710 


F = 339.31092 

Signif 

F = .0000 





Variables 

in the equation 


Variable 

B 

SE B 

95% Confdnce 

Intrvl B 

STARCH 

.33563 

.01814 

.29828 

.37298 

FLOUR 

1.44228 

.20764 

1.01465 

1.86991 

(Constant) 

19.43976 

2.18829 

14.93290 

23.94662 
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acerca del contenido energético de los desechos. Los auto¬ 
res del artículo “Modeling the Energy Contení of Municipal 
Solid Waste Using Múltiple Regression Analysis” ( J. ofthe 
Air and Waste Mgmt. Assoc., 1996: 650-656) bondadosa¬ 
mente nos proporcionaron la información siguiente acerca 
de y = contenido energético (kcal/kg), las tres variables fí¬ 
sicas de composición x t = % de plástico por peso, x 2 = % 
de papel por peso y x 3 = % de basura por peso, y la varia¬ 
ble próxima de análisis x 4 = % de humedad por peso para 
especímenes de desechos de cierta región. 

Contenido 


Obs 

Plástico 

Papel 

Basura 

Agua energético 

1 

18.69 

15.65 

45.01 

58.21 

947 

2 

19.43 

23.51 

39.69 

46.31 

1407 

3 

19.24 

24.23 

43.16 

46.63 

1452 

4 

22.64 

22.20 

35.76 

45.85 

1553 

5 

16.54 

23.56 

41.20 

55.14 

989 

6 

21.44 

23.65 

35.56 

54.24 

1162 

7 

19.53 

24.45 

40.18 

47.20 

1466 

8 

23.97 

19.39 

44.11 

43.82 

1656 

9 

21.45 

23.84 

35.41 

51.01 

1254 

10 

20.34 

26.50 

34.21 

49.06 

1336 

11 

17.03 

23.46 

32.45 

53.23 

1097 

12 

21.03 

26.99 

38.19 

51.78 

1266 

13 

20.49 

19.87 

41.35 

46.69 

1401 

14 

20.45 

23.03 

43.59 

53.57 

1223 

15 

18.81 

22.62 

42.20 

52.98 

1216 

16 

18.28 

21.87 

41.50 

47.44 

1334 

17 

21.41 

20.47 

41.20 

54.68 

1155 

18 

25.11 

22.59 

37.02 

48.74 

1453 

19 

21.04 

26.27 

38.66 

53.22 

1278 

20 

17.99 

28.22 

44.18 

53.37 

1153 

21 

18.73 

29.39 

34.77 

51.06 

1225 

22 

18.49 

26.58 

37.55 

50.66 

1237 

23 

22.08 

24.88 

37.07 

50.72 

1327 

24 

14.28 

26.27 

35.80 

48.24 

1229 

25 

17.74 

23.61 

37.36 

49.92 

1205 

26 

20.54 

26.58 

35.40 

53.58 

1221 

27 

18.25 

13.77 

51.32 

51.38 

1138 

28 

19.09 

25.62 

39.54 

50.13 

1295 

29 

21.25 

20.63 

40.72 

48.67 

1391 

30 

21.62 

22.71 

36.22 

48.19 

1372 

El uso del MINITAB para ajustar un modelo de regresión 


múltiple, con las cuatro variables citadas líneas antes como 
predictores de contenido energético, produjo la siguiente 
salida: 

The regression equation is 
enercont=2245+28.9 plastics 

+ 7.64 paper + 4.30 garbage 
-37.4 water 


Predictor 

Coef 

StDev 

T 

P 

Constant 

2244.9 

177.9 

12.62 

0.000 

plastics 

28.925 

2.824 

10.24 

0.000 

paper 

7.644 

2.314 

3.30 

0.003 

garbage 

4.297 

1.916 

2.24 

0.034 

water 

-37.354 

1.834 

-20.36 

0.000 

s = 31.48 

R-Sg = 96.4 

%R-Sq(adj) 

= 95.8% 



(continúa en la parte superior de la siguiente columna ) 
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Analysis of 

Variance 




Source 

DF 

SS 

MS 

F 

P 

Regression 

4 

664931 

166233 

167.71 

0.000 

Error 

25 

24779 

991 



Total 

29 

689710 





a. Interprete los valores de los coeficientes de regresión es¬ 
timada j6¡ y jS 4 . 

b. Exprese y pruebe las hipótesis apropiadas para determi¬ 
nar si el ajuste del modelo a los datos especifica una re¬ 
lación lineal útil entre contenido energético y al menos 
uno de los cuatro predictores. 

c. Dado que el % de plástico, % de papel y % de agua per¬ 
manecen en el modelo, ¿el % de basura da información 
útil acerca del contenido energético? Exprese y pruebe 
las hipótesis apropiadas usando un nivel de significación 
de 0.05. 

d. Utilice el hecho de que Sy = 7.46 cuando x x = 20, x 2 = 
25, x 3 = 40 y x 4 = 45 para calcular un intervalo de con¬ 
fianza de 95% para el verdadero contenido energético 
promedio bajo estas circunstancias. ¿El intervalo resul¬ 
tante sugiere que el contenido energético medio ha sido 
estimado con precisión? 

e. Use la información dada en el inciso d) para predecir el 
contenido energético, para una muestra de desechos que 
tenga las características especificadas, de modo que lle¬ 
ve información acerca de precisión y confiabilidad. 

48. Un experimento para investigar los efectos de una nueva 
técnica para desengomar seda se describe en el artículo 
“Some Studies in Degumming of Silk with Organic Acids” 
(J. Society ofDyers and Colourists, 1992: 79-86). Una va¬ 
riable de respuesta de interés fue y = pérdida de peso (%). 
Los experimentadores hicieron observaciones de pérdida 
de peso para diversos valores de tres variables independien¬ 
tes: x¡ = temperatura (°C) = 90, 100, 110; x 2 = tiempo de 
tratamiento (min) = 30, 75, 120; x 3 = concentración de áci¬ 
do tartárico (g/1) = 0, 8, 16. En los análisis de regresión, los 
tres valores de cada variable se codificaron como — 1, 0 y 1, 
respectivamente y dieron los datos siguientes (el valor v 8 = 
19.3 se reportó, pero el valor v 8 = 20.3 produjo una salida 
de regresión idéntica a la que aparece en el artículo). 


Obs 

i 

2 

3 

4 

5 

6 

7 

8 

*i 

-i 

-1 

1 

1 

-1 

-1 

1 

1 

*2 

-i 

1 

-1 

1 

0 

0 

0 

0 

*3 

0 

0 

0 

0 

-1 

1 

-1 

1 

y 

18.3 

22.2 

23.0 

23.0 

3.3 

19.3 

19.3 

20.3 

Obs 

9 

10 

11 

12 

13 

14 

15 


*i 

0 

0 

0 

0 

0 

0 

0 


*2 

-1 

-1 

1 

1 

0 

0 

0 


*3 

-1 

1 

-1 

1 

0 

0 

0 


y 

13.1 

23.0 

20.9 

21.5 

22.0 

21.3 

22.6 



Un modelo de regresión múltiple con k — 9 predictores 

—* 1 > * 2 > * 3 ’ *4 = * 1 > *5 = * 2 > *6 = 4 *7 = * 1 * 2 . *8 = * 1*3 Y 
x 9 = XtX ¡— se ajustó a los datos y dio por resultado 
Po = 21.967, jSj = 2.8125, )3 2 = 1.2750, j8 3 = 3.4375, 
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/3 4 = -2.208, /3 5 = 1.867, /3 6 = -4.208, /3 7 =-0.975, 
jS 8 = -3.750, 0 g = -2.325, SCE = 23.379 y R 2 = 0.938. 

a. ¿Este modelo especifica una relación útil? Exprese y 
pruebe las hipótesis apropiadas usando un nivel de sig¬ 
nificación de 0 . 01 . 

b. La desviación estándar estimada de fi Y cuando x¡ = • • • = 
x g = 0 (es decir, cuando la temperatura = 100 , el tiem¬ 
po = 75 y la concentración = 8 ) es 1.248. Calcule un in¬ 
tervalo de confianza de 95% para la pérdida de peso 
esperada cuando la temperatura, el tiempo y la concen¬ 
tración tengan los valores especificados. 

c. Calcule un intervalo de predicción para observar un so¬ 
lo valor de pérdida de peso cuando la temperatura, el 
tiempo y la concentración tengan valores de 100, 75 y 8 , 
respectivamente. 

d. El ajuste del modelo con sólo x¡, x 2 y x 3 como predicto- 

res dio R 2 = 0.456 y SCE = 203.82. ¿Hay una relación 
útil entre pérdida de peso y al menos uno de los predic- 
tores de segundo orden x 4 , x¡, , x 9 ? Exprese y prue¬ 

be las hipótesis apropiadas. 

49. El artículo “The Influence of Temperature and Sunshine on 
the Alpha-Acid Contents of Hops (Agricultural Meteoro- 
logy, 1974: 375-382) informa de los siguientes datos en la 
producción (y), temperatura media del periodo entre la fe¬ 
cha al recibir el lúpulo y fecha de cosecharlo (Xj), y porcen¬ 
taje medio de luz solar durante el mismo periodo (x 2 ) para 
una variedad de lúpulo: 


Xj 

16.7 

17.4 

18.4 

16.8 18.9 

17.1 

x 2 

30 

42 

47 

47 43 

41 

y 

210 

110 

103 

103 91 

76 

Xj 

17.3 

18.2 

21.3 

21.2 20.7 

18.5 

x 2 

48 

44 

43 

50 56 

60 

y 

73 

70 

68 

53 45 

31 

A continuación se muestra una salida parcial de MINITAB 
por el ajuste del modelo de primer orden Y = /3 0 + ¡3 l x 1 + 

/3,x 2 + e empleado en el artículo: 



Predictor 

Coef 

Stdev 

t-ratio 

P 

Constant 

415.11 

82.52 

5.03 

0.000 

Temp 


-6.593 

4.859 

-1.36 

0.208 

Sunshine 

-4.504 

1.071 

-4.20 

0.002 


s = 24.45 R-sq = 76.8% R-sq(adj) =71.6% 

a. ¿Qué es jx Y . i8 9 43 , y cuál es el residuo correspondiente? 

b. Pruebe H n : 6, = 6, = 0 en función de H ya sea 6, o 
f} 2 A 0 al nivel de 6.05. 

c. La desviación estándar estimada de /3 0 + j8 1 x¡ + /3 2 x 2 
cuando x, = 18.9 y x 2 = 43 es 8.20. Use esto para obte¬ 
ner un intervalo de confianza de 95% para /x Y . ls 943 . 

d. Use la información del inciso c) a fin de obtener un in¬ 
tervalo de predicción para la producción en un experi¬ 
mento futuro cuando x¡ = 18.9 y x, = 43. 

e. MINITAB reportó que un intervalo de predicción de 
95% para producción cuando x¡ = 18 y x 2 = 45 es 
(35.94, 151.63). ¿Cuál es un intervalo de predicción de 
90% en esta situación? 

f. Dado que x 2 está en el modelo, ¿retendría el lector a x{! 


g. Cuando el modelo Y = ¡8 0 + jS 2 x, + e se ajusta, el va¬ 
lor resultante de R 2 es 0.721. Verifique que el estadístico 
F para probar H 0 : Y = f) 0 + j8tX 2 + e en función de 
H a : Y = j8 0 + fi l x l + íi 2 x 2 + e satisface t 2 = /, donde t 
es el valor del estadístico t del inciso f). 

50. a. Cuando el modelo Y = j3 0 + )3 1 x 1 + )3 2 x 2 + fi 3 x\ + 

jS 4 Xt + ]8 5 x 1 x 2 + e se ajusta a los datos de lúpulos del 
ejercicio 49, la estimación de f3¡ es fi 5 = 0.557 con des¬ 
viación estándar estimada ss s = 0.94. Pruebe H 0 : j8 5 = 0 
en función de í/ a : j8 5 A 0. 

b. Cada razón t fi/s(i — 1, 2, 3, 4, 5) para el modelo del 
inciso a) es menor a 2 en valor absoluto, pero R 2 = 
0.861 para este modelo. ¿Sería correcto eliminar cada 
uno de los términos del modelo debido a su pequeña ra¬ 
zón f? Explique. 

c. Con el uso de R 2 = 0.861 para el modelo del inciso a), 
pruebe H 0 : j8 3 = j3 4 = /3 5 = 0 (que dice que todos los 
términos de segundo orden se pueden eliminar). 

51. El artículo “The Undrained Strength of Some Thawed Per- 
mafrost Soils” (Canadian Geotechnical J., 1979: 420-427) 
contiene los siguientes datos sobre la resistencia al corte de 
suelos arenosos (y, en kPa), profundidad (x,, en m), y con¬ 
tenido de agua (x 2 , en %). 



y 


x 2 

y 

y -y 

e* 

1 

14.7 

8.9 

31.5 

23.35 

-8.65 

-1.50 

2 

48.0 

36.6 

27.0 

46.38 

1.62 

0.54 

3 

25.6 

36.8 

25.9 

27.13 

-1.53 

-0.53 

4 

10.0 

6.1 

39.1 

10.99 

-0.99 

-0.17 

5 

16.0 

6.9 

39.2 

14.10 

1.90 

0.33 

6 

16.8 

6.9 

38.3 

16.54 

0.26 

0.04 

7 

20.7 

7.3 

33.9 

23.34 

-2.64 

-0.42 

8 

38.8 

8.4 

33.8 

25.43 

13.37 

2.17 

9 

16.9 

6.5 

27.9 

15.63 

1.27 

0.23 

10 

27.0 

8.0 

33.1 

24.29 

2.71 

0.44 

11 

16.0 

4.5 

26.3 

15.36 

0.64 

0.20 

12 

24.9 

9.9 

37.8 

29.61 

-4.71 

-0.91 

13 

7.3 

2.9 

34.6 

15.38 

-8.08 

-1.53 

14 

12.8 

2.0 

36.4 

7.96 

4.84 

1.02 


Los valores y residuos pronosticados se calcularon ajustan- 
do un modelo cuadrático completo, que produjo la función 
de regresión estimada 

y = -151.36 - 16.22.Xj + 13.48x 2 + 0.094xy 
— 0.253x 2 + 0.492xjX 2 

a. Las gráficas de e* en función de x lt e* en función de x 2 , 
y e* en función de y, ¿sugieren que el modelo cuadráti¬ 
co completo debe modificarse? Explique su respuesta. 

b. El valor de R 2 para el modelo cuadrático completo es 
0.759. Pruebe al nivel 0.05 la hipótesis nula, expresando 
que no hay relación lineal entre la variable dependiente 
y cualquiera de los cinco predictores. 

c. Se puede demostrar que V(Y) = cr 2 = V{Y) + V(Y — Y). 
La estimación de a esa = í = 6.99 (del modelo cuadrá¬ 
tico completo). Primero obtenga la desviación estándar 
estimada de Y — Y y entonces estime la desviación es¬ 
tándar de Y (es decir, 0 O + 0 l x 1 + j8 2 x 2 + 0¡x\ + 
j8 4 x 2 + jS 5 XjX 2 ) cuando x¡ = 8.0 y x 2 = 33.1. Por último, 
calcule un intervalo de confianza de 95% para resisten¬ 
cia media. [Sugerencia: ¿Qué es (y — y)/e*?] 
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d. El ajuste del modelo de primer orden con función de re¬ 
gresión Hy-n-ja ~ Po + Pi x ¡ + Pi x 2 produjo una SCE = 
894.95. Pruebe al nivel 0.05 la hipótesis nula que expre¬ 
sa que todos los términos cuadráticos se pueden elimi¬ 
nar del modelo. 


más bien complicados x¡ {¡jí g-s/m 3 ) y x 2 (/ag/m 2 ) definidos 
en términos de concentraciones de aire PAH para varias es¬ 
pecies, tiempo total, y cantidad total de precipitación. A 
continuación aparece la información sobre fluoranteno de 
especies y la correspondiente salida de MINITAB: 


52. La utilización de sacarosa como fuente de carbono para la 
producción de sustancias químicas es antieconómica. La 
melaza de remolacha es un sustituto que se puede obtener 
con facilidad y es de bajo precio. El artículo “Optimization 
of the Production of j8-Carotene from Molasses by Blakes- 
leaTrispora ( J. of Chemical Technology and Biotechnology, 
2002: 933-943) llevó a cabo un análisis de regresión múlti¬ 
ple para relacionar la variable dependiente y = cantidad de 
/3 caroteno (g/dm 3 ) con la cantidad de ácido linoleico de los 
tres predictores, cantidad de queroseno y cantidad de antio¬ 
xidante (todos en g/dm 3 ). 


Obs 

Linoleico 

Queroseno 

Antioxidante 

Betacaro 

1 

30.00 

30.00 

10.00 

0.7000 

2 

30.00 

30.00 

10.00 

0.6300 

3 

30.00 

30.00 

18.41 

0.0130 

4 

40.00 

40.00 

5.00 

0.0490 

5 

30.00 

30.00 

10.00 

0.7000 

6 

13.18 

30.00 

10.00 

0.1000 

7 

20.00 

40.00 

5.00 

0.0400 

8 

20.00 

40.00 

15.00 

0.0065 

9 

40.00 

20.00 

5.00 

0.2020 

10 

30.00 

30.00 

10.00 

0.6300 

11 

30.00 

30.00 

1.59 

0.0400 

12 

40.00 

20.00 

15.00 

0.1320 

13 

40.00 

40.00 

15.00 

0.1500 

14 

30.00 

30.00 

10.00 

0.7000 

15 

30.00 

46.82 

10.00 

0.3460 

16 

30.00 

30.00 

10.00 

0.6300 

17 

30.00 

13.18 

10.00 

0.3970 

18 

20.00 

20.00 

5.00 

0.2690 

19 

20.00 

20.00 

15.00 

0.0054 

20 

46.82 

30.00 

10.00 

0.0640 


a. El ajuste del modelo completo de segundo orden en 
los tres predictores dio por resultado R 2 = 0.987 y R 2 
ajustada igual a 0.974, mientras que el ajuste del mode¬ 
lo de primer orden dio R 2 = 0.016. ¿Qué se concluiría 


obs 

xl 

x2 


flth 

1 

92017 

.0026900 


278 

.78 

2 

51830 

.0030000 


124 

.53 

3 

17236 

.0000196 


22 

.65 

4 

15776 

.0000360 


28 

.68 

5 

33462 

.0004960 


32 

.66 

6 

243500 

.0038900 


604 

.70 

7 

67793 

.0011200 


27 

.69 

8 

23471 

.0006400 


14 

.18 

9 

13948 

.0004850 


20 

.64 

10 

8824 

.0003660 


20 

.60 

11 

7699 

.0002290 


16 

.61 

12 

15791 

.0014100 


15 

.08 

13 

10239 

.0004100 


18 

.05 

14 

43835 

.0000960 


99 

.71 

15 

49793 

.0000896 


58 

.97 

16 

40656 

.0026000 


172 

.58 

17 

50774 

.0009530 


44 

.25 

The regression equation 

is 




flth = -33.5 + 0.00205 xl 

+ 29836 x2 




Predictor 

Coef 

SE Coef 

T 


P 

Constant 

-33.46 

14.90 

-2.25 

0 . 

041 

xl 

0.0020548 

0.0002945 

6.98 

0 . 

000 

x2 

29836 

13654 

2.19 

0 . 

046 

S =44.28 

R-Sq = 92.3% 

R-Sq(adj) 

= 91.2% 



Analysis of 

Variance 





Source 

DF 

SS MS 

F 


P 

Regression 

2 330989 165495 

84.39 

0 . 

000 

Residual Error 14 27454 1961 




Total 

16 358443 





Formule preguntas y efectúe análisis apropiados para sacar 
conclusiones. 

54. Los datos siguientes son el resultado de un estudio de la re¬ 
lación entre brillo de papel acabado (y) y las variables por¬ 
centaje de H 2 Ot por peso (xf), porcentaje de NaOH por peso 
(x 2 ), porcentaje de silicato por peso (jc 3 ) y temperatura del 
proceso (xf) (“Advantages of CEHDP Bleaching for High 
Brightness Kraft Pulp Production”, TAPPI, 1964: 170A- 
173A). Se dejó que cada variable independiente tomara cin¬ 
co valores diferentes y estos valores se codificaron para 


acerca de los dos modelos? 

b. Para x¡ = x 2 = 30, x 3 = 10, un paquete de software de 
estadística reportó que y = 0.66573, sp = 0.01785 con 
base en el modelo completo de segundo orden. Pronos¬ 
tique la cantidad de /3 caroteno que resultaría de un solo 
ciclo experimental con los valores designados de las va¬ 
riables independientes, y hágalo de modo que lleve in¬ 
formación acerca de precisión y confiabilidad. 

53. Los campos nevados contienen un amplio espectro de con¬ 
taminantes que pueden representar riesgos ambientales. El 
artículo “Atmospheric PAH Deposition: Deposition Veloci- 
ties and Washout Ratios” (J. of Environmental Engineering , 
2002: 186-195) se concentró en la precipitación de hidro¬ 
carburos poliaromáticos. Los autores propusieron un mode¬ 
lo de regresión múltiple para relacionar la precipitación en 
un tiempo especificado (y, en ¿ig/m 2 ) contra dos predictores 


análisis de regresión como —2, —1,0, 1 y 2. 


Núm. 

de 

prueba 

h 2 o 2 

(*l) 

Conc. 
de NaOH 

(* 2 ) 

Conc. de 
silicato 

(•*3) 

Temp. 

(*4) 

Brillo 

(y) 

1 

-1 

-1 

-1 

-1 

83.9 

2 

+ 1 

-1 

-1 

-1 

84.9 

3 

-1 

+ 1 

-1 

-1 

83.4 

4 

+ 1 

+ 1 

-1 

-1 

84.2 

5 

-1 

-1 

+ 1 

-1 

83.8 

6 

+ 1 

-1 

+ 1 

-1 

84.7 

7 

-1 

+ 1 

+ 1 

-1 

84.0 

8 

+ 1 

+ 1 

+ 1 

-1 

84.8 

9 

-1 

-1 

-1 

+ 1 

84.5 

10 

+ 1 

-1 

-1 

+ 1 

86.0 


{continúa) 
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Núm. Conc. Conc. de 

de H 2 0 2 de NaOH silicato Temp. Brillo 

prueba (*,) (*,) (*,) (* 4 ) (y) 


11 

-1 

+ 1 


-1 

+ 1 

82.6 

12 

+ 1 

+ 1 


-1 

+ 1 

85.1 

13 

-1 

-1 


+ 1 

+ 1 

84.5 

14 

+ 1 

-1 


+ 1 

+ 1 

86.0 

15 

-1 

+ 1 


+ 1 

+ 1 

84.0 

16 

+ 1 

+ 1 


+ 1 

+ 1 

85.4 

17 

-2 

0 


0 

0 

82.9 

18 

+2 

0 


0 

0 

85.5 

19 

0 

-2 


0 

0 

85.2 

20 

0 

+ 2 


0 

0 

84.5 

21 

0 

0 


-2 

0 

84.7 

22 

0 

0 


+2 

0 

85.0 

23 

0 

0 


0 

-2 

84.9 

24 

0 

0 


0 

+2 

84.0 

25 

0 

0 


0 

0 

84.5 

26 

0 

0 


0 

0 

84.7 

27 

0 

0 


0 

0 

84.6 

28 

0 

0 


0 

0 

84.9 

29 

0 

0 


0 

0 

84.9 

30 

0 

0 


0 

0 

84.5 

31 

0 

0 


0 

0 

84.6 

Variables 


-2 

-1 

0 

+ 1 +2 

*i 

Peróxido de hidrógeno 






(100%), % peso 

0.1 

0.2 

0.3 

0.4 0.5 

*2 

NaOH, % peso 


0.1 

0.2 

0.3 

0.4 0.5 

* 3 

Silicato (41°Bé), 







% peso 


5 

1.5 

2.5 

3.5 4.5 

*4 

Temp. de proceso, °F 

130 

145 

160 

175 190 


a. Cuando se ajustó un modelo (codificado) que compren¬ 
da todos los términos lineales, todos los términos cua- 
dráticos y todos los términos de producto cruz, la función 
de regresión estimada fue 

y = 84.67 + 0.650*! — 0.258* 2 + 0.133* 3 
+ 0.108.v 4 - 0.135*i + 0.028*| + 0.028*^ 

— 0.072*| + 0.038*i* 2 — 0.075*!*3 
+ 0.213*j*4 + 0.200*2*3 — 0.188*2*4 
+ 0.050*3*4 

Utilice este modelo estimado para predecir el brillo cuando 
fU0 2 es 0.4%, NaOH es 0.4%, silicato es 3.5% y la tempe¬ 
ratura es 175. ¿Cuáles son los valores de los residuos para 
estos valores de las variables? 

b. Exprese la función de regresión estimada en forma no 
codificada. 

c. STC = 17.2567 y R 1 para el modelo del inciso a) es 
0.885. Cuando se ajusta un modelo que incluye sólo los 
cuatro términos lineales, el valor resultante de R 2 es 0.721. 
Exprese y pruebe al nivel 0.05 la hipótesis nula que es¬ 
pecifica que los coeficientes, de todos los términos cua- 
dráticos y de producto cruz de la función de regresión, 
son cero. 

d. La función de regresión estimada (codificada) cuando se 

incluyen sólo términos lineales es = 84.5548 + 

0.6500*! — 0.2583*2 + 0.1333* 3 + 0.1083* 4 . Cuando 
*! — * 2 = *3 = * 4 = 0 , la desviación estándar estima¬ 
da de Ay-oooo es 0.0772. Suponga que se había creído 
que el brillo esperado para estos valores de las x¡ era al 
menos 85.0. ¿La información dada contradice esta 
creencia? Exprese y pruebe las hipótesis apropiadas. 



13.5 Otros problemas en regresión múltiple 


En esta sección, se tratan superficialmente varios problemas que pueden surgir cuando se 
efectúa un análisis de regresión múltiple. En las referencias de este capítulo consulte un tra¬ 
tamiento más extenso de cualquier tema particular. 

Transformaciones en regresión múltiple 

En ocasiones, las consideraciones teóricas sugieren una relación no lineal entre una varia¬ 
ble dependiente y dos o más variables independientes, mientras que en otras ocasiones las 
gráficas de diagnóstico indican que debe usarse algún tipo de función no lineal. Es frecuen¬ 
te que una transformación haga lineal al modelo. 

Ejemplo 13.18 Un artículo en Lubrication Eng. (“Accelerated Testing of Solid Film Lubricants”, 1972: 

365-372) reporta sobre una investigación de la duración de lubricantes de película sólida. Se 
efectuaron tres conjuntos de pruebas de cojinetes en una película tipo Mil-L-8937 en cada 
combinación de tres cargas (3 000, 6 000 y 10 000 psi) y tres velocidades (20, 60 y 100 rpm), 
y se registró la duración (horas) de cada carrera, como se muestra en la tabla 13.7. 
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13.5 Otros problemas en regresión múltiple 551 


Tabla 13.7 Datos de duración para el ejemplo 13.18 


s 

/(lOOOs) 

w 

s 

/(1000s) 

w 

20 

3 

300.2 

60 

6 

65.9 

20 

3 

310.8 

60 

10 

10.7 

20 

3 

333.0 

60 

10 

34.1 

20 

6 

99.6 

60 

10 

39.1 

20 

6 

136.2 

100 

3 

26.5 

20 

6 

142.4 

100 

3 

22.3 

20 

10 

20.2 

100 

3 

34.8 

20 

10 

28.2 

100 

6 

32.8 

20 

10 

102.7 

100 

6 

25.6 

60 

3 

67.3 

100 

6 

32.7 

60 

3 

77.9 

100 

10 

2.3 

60 

3 

93.9 

100 

10 

4.4 

60 

6 

43.0 

100 

10 

5.8 

60 

6 

44.5 





El artículo contiene el comentario de que una distribución lognormal es apropiada pa¬ 
ra W, porque se sabe que ln(VE) sigue una ley normal (recuerde del capítulo 4 que esto es lo 
que define una distribución lognormal). El modelo que aparece es W = ( cls a l b ) • e, del cual 
ln(W) = ln(c) — a ln(í) — b ln(/) + ln(e); entonces, con Y = ln(VE), x x = ln(.y), x 2 = ln(/), 
/3 0 = ln(c), ¡3 l = -a y j8 2 = —b, se tiene un modelo de regresión lineal simple. Después de 
calcular ln(w,), ln(.y ; ) y ln(/ r ) para los datos, un modelo de primer orden en las variables 
transformadas dio los resultados que se muestran en la tabla 13.8. 


Tabla 13.8 Coeficientes estimados y razones f para el ejemplo 13.18 


Parámetro /3, 

Estimación ¡i, 

DE estimada .sy¡ 

t = Pi/Sp, 

/3 0 

10.8719 

0.7871 

13.81 

0i 

-1.2054 

0.1710 

-7.05 

02 

-1.3979 

0.2327 

-6.01 


El coeficiente de determinación múltiple (para el ajuste transformado) tiene un valor 
R 2 = 0.781. La función de regresión estimada para las variables transformadas es 

ln(vv) = 10.87 -1.21 ln(.s) - 1.40 ln(/) 

de modo que la función de regresión original se estima como 

w = e 10 - 87 • í ~ L21 • r 1 - 40 

Se puede usar el método Bonferroni para obtener intervalos de confianza simultáneos pa- 
ra ¡3¡ y ¡5 2 y porque /3[ = —a y = —b, los intervalos para a y b están disponibles de 
inmediato. ■ 


En la sección 13.2, el modelo de regresión logística se introdujo para relacionar una 
variable dicotómica y con un solo predictor. Este modelo se puede extender en una forma 
obvia para incorporar más de un predictor. 


Estandarización de variables 

En la sección 13.3 se consideró transformar x en x' = x — x antes de ajustar un polinomio. 
Para regresión múltiple, en especial cuando los valores de variables son grandes en magni¬ 
tud, es ventajoso adelantar un paso más esta codificación. Sean x¡ y s¡ el promedio muestral 
y la desviación estándar muestral de las x- (j = !,...,«). Ahora se codifica cada variable x¡ 
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por x¡ = (x¡ — x¡)/s¡. La variable codificada x'¡ simplemente vuelve a expresar cualquier va¬ 
lor x¡ en unidades de desviación estándar arriba o debajo de la media. Entonces, si x¡ =100 
y s¡ = 20, x¡ = 130 se convierte en x'¡ = 1.5 porque 130 está 1.5 desviaciones estándar arri¬ 
ba de la media de los valores de x¡. Por ejemplo, el modelo completo codificado de segundo 
orden con dos variables independientes tiene función de regresión 


E(Y) 


0o + 0i^ 










0o 01 V 1 &2 X 2 03 X 3 0 4 X 4 Ps X 5 


Los beneficios de codificar son 1) precisión numérica mejorada en todos los cálculos (con 
menos error de redondeo en computadora), y 2) estimación más precisa que para los paráme¬ 
tros del modelo no codificado, porque los parámetros individuales del modelo codificado 
caracterizan el comportamiento de la función de regresión cerca del centro de los datos, en 
lugar de cerca del origen. 


Ejemplo 13.19 El artículo “The Valué and the Limitations of High-Speed Turbo-Exhausters for the Remo- 
val of Tar-Fog from Carburetted Water-Gas” ( Soc. Chemical Industry J., 1946: 166-168) pre¬ 
senta los datos (en la tabla 13.9) sobre y = contenido de alquitrán (granos/100 pie 3 ) de una 
corriente de gas como función de x¡ = velocidad del rotor (rpm) y x 2 = temperatura del gas 
de entrada (°F). La información también está considerada en el artículo “Some Aspects of 
Nonorthogonal Data Analysis” ( J. Quality Technology, 1973: 67-79), que sugiere el uso del 
modelo codificado descrito previamente. 


Tabla 13.9 Datos para el ejemplo 13.19 


Ciclo 

y 

*i 

*2 


*2 

1 

60.0 

2400 

54.5 

-1.52428 

-0.57145 

2 

61.0 

2450 

56.0 

-1.39535 

-0.35543 

3 

65.0 

2450 

58.5 

-1.39535 

0.00461 

4 

30.5 

2500 

43.0 

-1.26642 

-2.22763 

5 

63.5 

2500 

58.0 

-1.26642 

-0.06740 

6 

65.0 

2500 

59.0 

-1.26642 

0.07662 

7 

44.0 

2700 

52.5 

-0.75070 

-0.85948 

8 

52.0 

2700 

65.5 

-0.75070 

1.01272 

9 

54.5 

2700 

68.0 

-0.75070 

1.37276 

10 

30.0 

2750 

45.0 

-0.62177 

-1.93960 

11 

26.0 

2775 

45.5 

-0.55731 

-1.86759 

12 

23.0 

2800 

48.0 

-0.49284 

-1.50755 

13 

54.0 

2800 

63.0 

-0.49284 

0.65268 

14 

36.0 

2900 

58.5 

-0.23499 

0.00461 

15 

53.5 

2900 

64.5 

-0.23499 

0.86870 

16 

57.0 

3000 

66.0 

0.02287 

1.08472 

17 

33.5 

3075 

57.0 

0.21627 

-0.21141 

18 

34.0 

3100 

57.5 

0.28073 

-0.13941 

19 

44.0 

3150 

64.0 

0.40966 

0.79669 

20 

33.0 

3200 

57.0 

0.53859 

-0.21141 

21 

39.0 

3200 

64.0 

0.53859 

0.79669 

22 

53.0 

3200 

69.0 

0.53859 

1.51677 

23 

38.5 

3225 

68.0 

0.60305 

1.37276 


{continúa) 
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Ciclo 

y 


x 2 

x i 

x 2 

24 

39.5 

3250 

62.0 

0.66752 

0.50866 

25 

36.0 

3250 

64.5 

0.66752 

0.86870 

26 

8.5 

3250 

48.0 

0.66752 

-1.50755 

27 

30.0 

3500 

60.0 

1.31216 

0.22063 

28 

29.0 

3500 

59.0 

1.31216 

0.07662 

29 

26.5 

3500 

58.0 

1.31216 

-0.06740 

30 

24.5 

3600 

58.0 

1.57002 

-0.06740 

31 

26.5 

3900 

61.0 

2.34360 

0.36465 


Las medias y desviaciones estándares son x l = 2991.13, s x = 387.81, x 2 = 58.468 y 
s 2 = 6.944, entonces x[ = (x, - 2991.13)/387.81 y x' 2 = (x 2 - 58.468)/6.944. Con x^ = 
(x¡) 2 , x\ = (x 2 ) 2 , x¡ = x\ • x' 2 , el ajuste del modelo completo de segundo orden exige resol¬ 
ver el sistema de seis ecuaciones normales con seis incógnitas. Un análisis de computado¬ 
ra dio /3 0 = 40.2660, 0! =-13.4041, )3 2 = 10.2553, j3 3 = 2.3313, /3 4 =-2.3405 y 
/3 5 = 2.5978. La ecuación de regresión estimada es entonces 

y = 40.27 - 13.40x; + 10.26x1, + 2.33x' - 2.34.< + 2.60x' 

Entonces, si x¡ = 3200 y x 2 = 57.0, x\ = 0.539, x 2 = -0.211, x' 3 = (0.539) 2 = 0.2901, 
x' 4 = (-0.211) 2 = 0.0447 yx' 5 = (0.539)(-0.211) = -0.1139, de modo que 

y = 40.27 - (13.40X0.539) + (10.26)(-0.211) + (2.33)(0.2901) 

- (2.34)(0.0447) + (2.60)(-0.1139) = 31.16 ■ 

Selección de variable 

Es frecuente que un experimentador tenga datos acerca de un gran número de predictores y 
desee construir un modelo de regresión que comprenda un subconjunto de los predictores. 
El uso del subconjunto hará más manejable el modelo resultante, en especial si se ha de re¬ 
colectar más información posteriormente y produce un modelo que es más fácil de interpre¬ 
tar y entender que uno con muchos predictores más. Dos preguntas fundamentales en 
relación con la selección de variables son las siguientes. 

1. Si se pueden examinar regresiones que comprendan todos los subconjuntos posibles de 
los predictores para las que se dispone de información, ¿qué criterios deben usarse para 
seleccionar un modelo? 

2. Si el número de predictores es demasiado grande para permitir examinar todas las regre¬ 
siones, ¿hay una forma de examinar un número reducido de subconjuntos entre los que 
se encontrará un buen modelo (o modelos)? 

Para abordar la primera pregunta, si el número de predictores es pequeño (< 5. por 
ejemplo), entonces no será demasiado tedioso examinar todas las regresiones posibles si se 
usa cualquiera de los paquetes de software de estadística, que se pueden obtener con facili¬ 
dad. Si se tiene la información de al menos seis predictores, todas las regresiones posibles 
comprenden al menos 64 (= 2 6 ) modelos diferentes. Varios paquetes darán, para cualquier 
m especificada entre 1 y 10, los mejores m modelos de un predictor, los mejores m modelos 
de dos predictores y así sucesivamente (“mejores”, aquí, significa la SCE más pequeña, o 
bien, lo que es equivalente, la R 2 máxima). MINITAB hará esto hasta para 20 predictores, 
mientras que el BMDP manejará hasta 27. Las SCE correspondientes (o funciones de ellas) se 
pueden comparar entonces de acuerdo con cualquiera de los criterios descritos a continuación. 
La razón para especificar una m mayor a uno es ver si los mejores modelos tienen valores se¬ 
mejantes de SCE o de R 2 . 
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Criterios para selección de una variable De nuevo se usa un subíndice k para denotar una 
cantidad (SCE ( , por ejemplo) calculada de un modelo con k predictores (y por tanto 
k + 1 de las ¡3¡, porque f3 0 siempre estará incluida). Para un valor fijo de k, es razonable iden¬ 
tificar el mejor modelo como el que tiene un SCE, mínimo. El problema más difícil trata la 
comparación de SCE /; para diferentes valores de k. Tres criterios diferentes, cada uno de 
ellos una función simple de SCE^, tienen uso generalizado. 


1. R\, el coeficiente de determinación múltiple para un modelo de k predictores. Como Rj. 
prácticamente aumentará cuando k se incremente (y nunca puede disminuir), no interesa 
la k que minimiza a R 2 k . En cambio, sí se desea identificar una k pequeña para la cual R\ 
es casi tan grande como R 2 para todos los predictores del modelo. 

2. CMEj. = SCE l(n — k — 1), el error cuadrático medio para un modelo con k predictores. 
Este se usa con frecuencia en lugar de R 2 k , porque aun cuando R 2 k nunca disminuye con k 
creciente, una pequeña disminución en SCE^. obtenida con un predictor extra puede ser 
más que compensación por una disminución de uno en el denominador de CME Í; . El ob¬ 
jetivo es entonces hallar el modelo que tenga un CME A . mínimo. Puesto que la ajustada 
R\ = 1 — CMEj/CMT, donde CMT = STC/(n — 1) es constante en k, el examen de la 
ajustada R 2 k es equivalente a la consideración de CME 4 . 

3. La justificación del tercer criterio, C k , es más difícil de entender, pero el criterio es utili¬ 
zado ampliamente por analistas de datos. Suponga que el verdadero modelo de regresión 
está especificado por m predictores, es decir, 

Y = Po + P i*i + • ' ' + P m x m + e V(e) = a 2 

de modo que 

E(Y) = (3 0 + ¡3^ + ■ ■ ■ + ¡3 m x m 

Considere ajustar un modelo mediante el uso de un subconjunto de k de estos m predic¬ 
tores; para más sencillez, suponga que se usa jc¡, x 2 , . . . , x k . Entonces al resolver el sis¬ 
tema de ecuaciones normales, se obtienen estimaciones ¡3 0 , /3 1? . . . , ¡3 k (pero no, por 
supuesto, estimaciones de ninguna de las ¡3 correspondientes a predictores que no estén 
en el modelo ajustado). El verdadero valor esperado E(Y) puede ser estimado por Y = 
¡3 0 + P l x l + ■ ■ ■ + ¡3 t x k . Ahora considere el error total de estimación esperado nor¬ 
malizado 


r* = 


£(2 [?, -£«) 


) E(SCE k ) 

- = , k + 2(k + 1) - n 

u l 


(13.21) 


La segunda igualdad en (13.21) debe tomarse de buena fe porque requiere un argumen¬ 
to complicado de valor esperado. Un subconjunto particular es entonces atractivo si su 
valor r t es pequeño. Desafortunadamente, sin embargo, £(SCEj.) y cr 2 no se conocen. Pa¬ 
ra solucionar esto, se denota con s 2 la estimación de cr 2 con base en el modelo que inclu¬ 
ye todas las pronosticadoras para las que se dispone de información y se define 

SCE,. 

C k = + 2(k + 1) - n 

Un modelo deseable es entonces especificado por un subconjunto de predictores para 
las que C k es pequeña. 


Ejemplo 13.20 El artículo de repaso de Ron Hocking citado en la bibliografía del capítulo reporta un aná¬ 
lisis de datos tomados de las ediciones de 1974 de la revista Motor Trend. La variable 
dependiente y fue el rendimiento de combustible, hubo n = 32 observaciones y los predic¬ 
tores para los que se obtuvo información fueron x¡ = forma del motor (1 = en línea 
y 0 = en V), x 2 = número de cilindros, x 3 = tipo de transmisión (1 = manual y 0 = auto). 
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x 4 = número de velocidades de la transmisión, x 5 = tamaño del motor, x 6 = potencia, x 7 = 
número de gargantas del carburador, x 8 = relación final de impulsión, x g = peso y x 10 = tiem¬ 
po en el cuarto de milla. En la tabla 13.10, se presenta información breve del análisis. La ta¬ 
bla describe, para cada k, el subconjunto que tenga una SCE A . mínima; hacia abajo en la 
columna de las variables se indica cuál variable se agrega al pasar de k a k + 1 (al pasar de 
k = 2 a k = 3 se suman x 3 y x 10 , y x 2 se elimina). La figura 13.18 contiene gráficas de R\, R\ 
ajustada, y C k en función de k; estas gráficas son una ayuda visual importante al seleccionar 
un subconjunto. La estimación de a 2 es s 2 = 6.24, que es CME 10 . Un modelo sencillo que se 
clasifica alto según todos los criterios es el que contiene los predictores x 3 , x 9 y x l0 . 


Tabla 13.10 Mejores subconjuntos para datos de rendimiento 
de combustible del ejemplo 13.20 


k = Número de 
predictores 

Variables 

SCE, 

R\ 

R\ ajustada 

c k 

1 

9 

247.2 

0.756 

0.748 

11.6 

2 

2 

169.7 

0.833 

0.821 

1.2 

3 

3, 10, -2 

150.4 

0.852 

0.836 

0.1 

4 

6 

142.3 

0.860 

0.839 

0.8 

5 

5 

136.2 

0.866 

0.840 

1.8 

6 

8 

133.3 

0.869 

0.837 

3.4 

7 

4 

132.0 

0.870 

0.832 

5.2 

8 

7 

131.3 

0.871 

0.826 

7.1 

9 

1 

131.1 

0.871 

0.818 

9.0 

10 

2 

131.0 

0.871 

0.809 

11.0 


íi\ Ajustada R 2 k C k 


0.90 

0.90 

12 


0.85 

• • • * # • • 

0.85 

10 




• . 8 


0.80 

0.80 





6 


0.75 

0.75 

4 

• 




• 

0.70 

0.70 

2 





2 4 6 8 10 

2 4 6 8 10 

2 4 6 8 10 


k 

k 

k 


Figura 13.18 Gráficas de y Qpara los datos de rendimiento de combustible. ■ 


En términos generales, cuando un subconjunto de k predictores (k < m) se usa pa¬ 
ra ajustar un modelo, las estimadoras /3 0 , /Sj, . . . , fí k estarán sesgadas por ¡3 0 , ¡3 lt , ¡3 k y 
Y también será una estimadora sesgada para la verdadera E(Y) (todo esto porque m — k pre¬ 
dictores faltan en el modelo ajustado). No obstante, según sean medidas por el error espe¬ 
rado normalizado total r t , las estimaciones basadas en un subconjunto pueden dar más 
precisión de la que se obtendría si se usan todos los predictores posibles; en esencia, esta 
mayor precisión se obtiene al precio de introducir un sesgo en las estimadoras. Un valor de 
k para el que C k ~ k + 1 indica que el sesgo asociado con este modelo de k predictores se¬ 
rá pequeño. 

La información de la resistencia de pegamento al corte, introducida en el ejemplo 13.12, con¬ 
tiene valores de cuatro variables independientes diferentes x { — x 4 . Se encuentra que el mo¬ 
delo con sólo estas cuatro variables como predictores fue útil, y no hay razón obligatoria 
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para considerar la inclusión de predictores de segundo orden. La figura 13.19 es la salida de 
MINITAB que resulta de una petición para identificar los dos mejores modelos de cada tama¬ 
ño dado. 

El mejor modelo de dos predictores, con predictores de potencia y temperatura, pare¬ 
ce ser una muy buena opción en todas las cantidades: R 2 es considerablemente más alta que 
para modelos con menos predictores pero casi tan grande como en modelos más grandes, R 2 
ajustada está casi a su máximo para estos datos y C k es pequeña y cercana a 2 + 1 =3. 


Response is 

strength 



f 

P 








O 

o 

t 

t 






r 

w 

e 

i 



Adj . 



c 

e 

m 

m 

Vars 

R-sq 

R-sq 

C-P 

s 

e 

r 

P 

e 

1 

57.7 

56.2 

11.0 

5.9289 


X 



1 

10.8 

7.7 

51.9 

8.6045 



X 


2 

68.5 

66.2 

3.5 

5.2070 


X 

X 


2 

59.4 

56.4 

11.5 

5.9136 


X 


X 

3 

70.2 

66.8 

4.0 

5.1590 


X 

X 

X 

3 

69.7 

66.2 

4.5 

5.2078 

X 

X 

X 


4 

71.4 

66.8 

5.0 

5.1580 

X 

X 

X 

X 


Figura 13.19 Salida de la opción Mejores Subconjuntos de MINITAB. ■ 


Regresión por pasos Cuando el número de predictores es demasiado grande para te¬ 
ner en cuenta el examen explícito o implícito de todos los subconjuntos posibles, varios pro¬ 
cedimientos de selección alternativos por lo general identificarán buenos modelos. El 
procedimiento más sencillo es el método de eliminación inversa (El). Este método empie¬ 
za con el modelo en el que se usan todos los predictores bajo consideración. Sea el conjun¬ 
to de todos los predictores x¡, . . . , x m . Entonces se examina cada una de las razones t 
(i = I. . . . , m) apropiada para probar H 0 : ¡3 i = 0 en función de // a : ¡6 ¡ A 0. Si la 
razón t con el valor absoluto más pequeño es menor que una constante especificada previa¬ 
mente ? salida , es decir, si 


mín 

1 = 1 , . . . , m 


& 


< t 


salida 


entonces el predictor que corresponde a la razón más pequeña se elimina del modelo. El mo¬ 
delo reducido se ajusta ahora, se examinan de nuevo las razones t m — 1 y se elimina otro pre¬ 
dictor si corresponde a la razón t absoluta más pequeña que ? salida . En esta forma, el algoritmo 
continúa hasta que, en alguna etapa, todas las razones t absolutas son al menos í salida . El mode¬ 
lo utilizado es el que contiene todos los predictores que no fueron eliminados. Es frecuente 
que el valor f salida = 2 se recomiende porque casi todos los valores í 0 05 son cercanos a 2. Al¬ 
gunos paquetes de software se concentran en valores P más que en razones t. 


Ejemplo 13.22 
(continúa del 
ejemplo 13.19) 


Para el modelo cuadrático completo codificado en el que y = contenido de alquitrán, los 
cinco predictores potenciales son x[, x' 2 , x r 3 = x[ 2 , x\ = x' 2 y x' 5 = x[x 2 (de modo que 
m = 5). Sin especificar f salida , el predictor con la razón t absoluta más pequeña (con asteris¬ 
co) se eliminó en cada etapa, produciendo la secuencia de modelos que se muestra en la ta¬ 
bla 13.11. 


Tabla 13.11 Resultados de eliminación inversa para los datos del ejemplo 13.19 



Razón 1 1 


Paso 

Predictores 

1 

2 

3 

4 

5 

1 

1,2, 3, 4, 5 

16.0 

10.8 

2.9 

2.8 

1.8* 

2 

1, 2, 3, 4 

15.4 

10.2 

3.7 

2.0* 

— 

3 

1, 2, 3 

14.5 

12.2 

4.3* 

— 

— 

4 

1, 2 

10.9 

9.1* 

— 

— 

— 

5 

1 

4.4* 

— 

— 

— 

— 
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Con el uso de f salida = 2, el modelo resultante estaría basado en x[, x' 2 y x' 3 , puesto que 
en el paso 3 no podría eliminarse ningún predictor. Puede verificarse que cada subconjunto 
es en realidad el mejor subconjunto de su tamaño, aunque bajo ninguna circunstancia éste 
siempre sea el caso. ■ 

Una alternativa al procedimiento de eliminación inversa es la selección directa (SD). 
SD empieza sin pronosticadoras en el modelo y considera ajustar a su vez el modelo con só¬ 
lo X,, sólo x 2 ,..., y finalmente sólo x m . La variable que, cuando se ajusta, da la razón t absolu¬ 
ta más grande, entra al modelo siempre que la razón rebase a la constante especificada f entrada . 
Suponga que x l entra al modelo. Entonces los modelos con (x u x 2 ), Cv,, jc 3 ), . . . , (x¡, x m ) se 
consideran a su vez. La | jS ¡Is^. | (J = 2, , rn) más grande especifica entonces el predictor 

entrante siempre que este máximo también exceda a í en trada- Esto continúa hasta que en 
algún paso ninguna de las razones t absolutas exceden de f entrada . Los predictores introducidos 
especifican entonces el modelo. El valor f entrada = 2 se usa con frecuencia por la misma 
razón que r sallda = 2 se usa en eliminación inversa (El). Para los datos de contenido de alqui¬ 
trán, la selección directa (SD) produjo la secuencia de modelos dada en los pasos 5, 4, ... , 
1 en la tabla 13.11 y por tanto está de acuerdo con la EI. Este no siempre será el caso. 

El procedimiento por pasos de más uso es una combinación de SD y El, denotado por 
SE. Este procedimiento empieza igual que la selección directa, agregando variables al mo¬ 
delo, pero después de cada adición examina las variables previamente introducidas para ver 
si cualquiera de ellas es candidata a eliminarse. Por ejemplo, si hay ocho predictores bajo 
consideración y el conjunto actual consta de x 2 , x 3 , x¡ y x 6 con x 5 acabando de ser agrega¬ 
da, se examinan las razones t ¡3-Js y /3 6 /í^ 6 . Si la razón absoluta más pequeña es me¬ 
nor que f salida , entonces se elimina del modelo la variable correspondiente. La idea que hay 
detrás de SE es que, con selección directa, una sola variable puede estar más relaciona¬ 
da con más fuerza con y que cualquiera de las dos o más variables individualmente, pero la 
combinación de estas variables puede hacer que con posterioridad la variable individual sea 
redundante. Esto ocurrió en realidad con los datos de rendimiento de combustible que se vio 
en el ejemplo 13.20, con x 2 entrando y subsecuentemente saliendo del modelo. 

El procedimiento SE es parte de varios paquetes estándar de software. El paquete 
BMDP especifica r entrada = 2 y f salida = V3.9 (casi todos los paquetes usan realmente / = t 2 
más que t en sí). 

Aun cuando en casi todas las situaciones estos procedimientos de selección automá¬ 
tica identificarán un buen modelo, no hay garantía de que resulte el mejor modelo o inclu¬ 
so uno que se le aproxime a éste. Debe hacerse un escrutinio minucioso de los conjuntos de 
datos para los que parece haber fuertes relaciones entre algunos de los potenciales predic¬ 
tores; en breve se tratará más de esto. 

Identificación de observaciones influyentes 

En regresión lineal simple, es fácil ubicar una observación cuyo valor x sea mucho mayor o 
mucho menor que otros valores x de la muestra. Esta observación puede tener un gran im¬ 
pacto en la ecuación de regresión estimada (si en realidad depende en qué tan consistente es 
el valor y correspondiente con el resto de los datos). En regresión múltiple, también es de¬ 
seable saber si los valores de los predictores para una observación particular son tales que 
tienen el potencial para ejercer gran influencia en la ecuación estimada. Un método para 
identificar observaciones potencialmente influyentes se apoya en el hecho de que como 
j3, es una función lineal de y,, y 2 , . . . , y„, cada valor y pronosticado de la forma y = j8 0 + 
/3[Xj + • ■ • + 0 t x t también es una función lineal de las y -. En particular, los valores pronos¬ 
ticados correspondientes a observaciones muéstrales se pueden escribir como sigue: 


h l2 y 2 + 

■ • + h u,y, 

^21.U ^22.^2 "E 

1 ■ + h 2 „y, 

K\y\ + /í „2.v 2 + • ■ 

1 • + K»y, 
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Cada uno de los coeficientes h- es una función de las x tJ de la muestra y no de las y y Se pue¬ 
de demostrar que h¡¡ = h¡¡ y que 0 ' hy ' 1. 

Hay que concentrarse en los coeficientes “diagonales” h n , h 22 , . . . ,h lm . El coeficien¬ 
te hy es el peso dado a y¿ al calcular el correspondiente valor pronosticado. Esta cantidad 
se puede expresar como una medida de la distancia entre el punto (x /y , . . . , x kj ) en espacio 
^-dimensional y el centro de los datos (x u , . . . , x k ). Por tanto, es natural caracterizar 
una observación cuya hy es relativamente grande como una que tiene influencia potencial¬ 
mente grande. A menos que haya una relación lineal perfecta entre los k predictores, 
2 "-1 hy = k + 1, así el promedio de las hy es (k + 1 )/n. Algunos estadísticos sugieren que 
si hy > 2(k + 1 )/n, la y-ésima observación se cite como potencialmente influyente; otros 
usan 3(k + 1 )/n como la línea divisoria. 

Ejemplo 13.23 Los datos siguientes aparecieron en el artículo “Testing for the Inclusión of Variables in Li¬ 
near Regression by a Randomization Technique” ( Technometrics, 1966: 695-699) y fue rea¬ 
nalizada en la obra de Hoaglin y Welsch, “The Hat Matriz in Regression and ANOVA” 
( Amer. Statistician , 1978: 17-23). Las h j] (con elementos debajo de la diagonal omitidos por 
simetría) siguen a los datos. 


Número de vigueta 

Gravedad específica (x,) 

Contenido de humedad (x 2 ) 

Resistencia (y) 

1 

0.499 

11.1 

11.14 

2 

0.558 

8.9 

12.74 

3 

0.604 

8.8 

13.13 

4 

0.441 

8.9 

11.51 

5 

0.550 

8.8 

12.38 

6 

0.528 

9.9 

12.60 

7 

0.418 

10.7 

11.13 

8 

0.480 

10.5 

11.70 

9 

0.406 

10.5 

11.02 

10 

0.467 

10.7 

11.41 




1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

1 

0.418 

-0.002 

0.079 

-0.274 

-0.046 

0.181 

0.128 

0.222 

0.050 

0.242 

2 


0.242 

0.292 

0.136 

0.243 

0.128 

-0.041 

0.033 

-0.035 

0.004 

3 



0.417 

-0.019 

0.273 

0.187 

-0.126 

0.044 

-0.153 

0.004 

4 




0.604 

0.197 

-0.038 

0.168 

-0.022 

0.275 

-0.028 

5 





0.252 

0.111 

-0.030 

0.019 

-0.010 

-0.010 

6 






0.148 

0.042 

0.117 

0.012 

0.111 

7 







0.262 

0.145 

0.277 

0.174 

8 








0.154 

0.120 

0.168 

9 









0.315 

0.148 

10 










0.187 


Aquí, k = 2 para que (k + 1 )ln = 3/10 = 0.3; como /z 44 = 0.604 > 2(0.3), el cuarto punto 
de datos se identifica como potencialmente influyente. ■ 

Otra técnica para evaluar la influencia de la y-ésima observación, que toma en cuenta 
yj así como los valores predictores, comprende eliminar la y-ésima observación del conjun¬ 
to de datos y efectuar una regresión con base en las observaciones restantes. Si los coefi¬ 
cientes estimados de la regresión de “observación borrada” difieren en gran medida de las 
estimaciones basadas en los datos completos, la y-ésima observación ha tenido claramente 
un impacto considerable en el ajuste. Una forma de juzgar si los coeficientes estimados 
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13.5 Otros problemas en regresión múltiple 559 

cambian grandemente es expresar cada cambio con relación a la desviación estándar esti¬ 
mada del coeficiente: 

f/3, antes del borrado) — (j8 ; después del borrado) cambio en/3 ; 


Existen fórmulas computacionales eficientes que permiten obtener toda esta información de 
la regresión “sin eliminar”, de modo que otras n regresiones no son necesarias. 


Ejemplo 13.24 Considere separadamente borrar las observaciones 1 y 6, cuyos residuos son los más grandes, 
(continúa del y la observación 4, donde es grande. La tabla 13.12 contiene la información relevante, 
ejemplo 13.23) 

Tabla 13.12 Cambios en coeficientes estimados para el ejemplo 13.24 


Parámetro 

Estimaciones sin borrar 

DE estimada 

Cambio cuando el punto j se borra 

7 = 1 j = 4 7 = 6 

0o 

10.302 

1.896 

2.710 

-2.109 

-0.642 

0i 

8.495 

1.784 

-1.772 

1.695 

0.748 

02 

0.2663 

0.1273 

-0.1932 

0.1242 

0.0329 



e r 

-3.25 

-0.96 

2.20 



h jr 

0.418 

0.604 

0.148 



Para borrar el punto 1 y el punto 4, el cambio en cada estimación está en el rango de 1 — 1.5 
desviaciones estándar, que es razonablemente importante (esto no nos dice qué ocurriría si 
ambos puntos se omitieran al mismo tiempo.) Para el punto 6, no obstante, el cambio es ca¬ 
si 0.25 de una desviación estándar. Por tanto, los puntos 1 y 4, pero no el 6, bien podrían 
omitirse al calcular una ecuación de regresión. ■ 

Multicolinealidad 

En numerosos conjuntos de datos de regresión múltiple, x¡, x 2 , . . . , x k son altamente inter¬ 
dependientes. Suponga que se considera el modelo usual 

Y= P o + 01*1 + ' • ' + P k x k + € 

con datos (jq., . . . , x k j, yj) (j = 1,...,«) disponibles para ajuste. Si se usa el principio de 
mínimos cuadrados para hacer regresión de x¡ en los otros predictores x¡, , x¡_ v x i+1 , . . 

. , x k , se obtiene 

x¡ = a 0 + a x x¡ + • • • + ci¡_ x x¡_ x + a i+l x i+l + • • • + a k x k 
se puede demostrar que 

V(P¡) = - (13.22) 

Z (*§ - x i¡) 

7 = 1 

Cuando los valores muéstrales x¡ se pueden predecir muy bien a partir de otros valores de 
pronóstico, el denominador de (13.22) será pequeño, de modo que V( p¡) será muy grande. 
Si éste es el caso para al menos un predictor, se dice que la información exhibe multicoli¬ 
nealidad. Es frecuente que la multicolinealidad sea sugerida por una salida computarizada 
de regresión en la que R 2 es grande, pero algunas de las razones t (3/sp. son pequeñas para 
predictores que, basados en información previa e intuición, parecen importantes. Otro indi¬ 
cio de la presencia de multicolinealidad está en un valor j8, que tiene el signo contrario de 
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560 CAPÍTULO 13 Regresión múltiple y no lineal 

aquel que sugeriría la intuición, lo que indica que otro predictor o conjunto de predictores 
está sirviendo como “apoderado” de x¡. 

Puede obtenerse una evaluación de la magnitud de la multicolinealidad si se hace re¬ 
gresión de cada predictor a la vez en los k — 1 predictores restantes. Denote con Kj el va¬ 
lor de la R 2 en la regresión con variable dependiente x¡ y predictores x¡, . . . , x¡ ¡, x i+l , . . 
., x k . Se ha sugerido que existe una severa multicolinealidad si R] > 0.9 para cualquier i. El 
MINITAB rechazará incluir un predictor en el modelo cuando su valor R] sea muy cercano 
a 1. 

Desafortunadamente, no hay consenso entre los expertos en estadística en lo que res¬ 
pecta a qué soluciones son apropiadas cuando esté presente una multicolinealidad. Una po¬ 
sibilidad comprende continuar con el uso de un modelo que incluya todos los predictores 
pero estimando parámetros con el uso de algo que no sean mínimos cuadrados. Para más de¬ 
talles, consulte una referencia del capítulo. 


EJERCICIOS Sección 13.5 (55-64) 


55. El artículo “Bank Full Discharge of Rivers” (Water Resour¬ 
ces J. 1978, 1141-1154) informa de datos acerca de la can¬ 
tidad de descarga ( q , en m 3 /s), área de flujo (a, en m 2 ) y 
pendiente de la superficie del agua (b, en m/m) obtenidos en 
diversas estaciones del área de inundación. A continuación 
aparece un subconjunto de los datos. El artículo propuso un 
modelo multiplicativo de potencia Q = aa^b y e. 


q 

17.6 

23.8 

5.7 

3.0 

7.5 

a 

8.4 

31.6 

5.7 

1.0 

3.3 

b 

0.0048 

0.0073 

0.0037 

0.0412 

0.0416 

q 

89.2 

60.9 

27.5 

13.2 

12.2 

a 

41.1 

26.2 

16.4 

6.7 

9.7 

b 

0.0063 

0.0061 

0.0036 

0.0039 

0.0025 


a. Utilice una transformación apropiada para que el mode¬ 
lo sea lineal y luego estime los parámetros de regresión 
para el modelo transformado. Por último, estime a, )3 y 
y (los parámetros del modelo original). ¿Cuál sería su 
predicción de cantidad de descarga cuando el área de 
flujo sea 10 y la pendiente sea de 0.01? 

b. Sin hacer en realidad ningún análisis, ¿cómo ajustaría us¬ 
ted un modelo exponencial multiplicativo Q = aeP a e yb e'í 

c. Después de una transformación a linealidad en el inciso 
a), un intervalo de confianza de 95% para el valor de la 
función de regresión transformada, cuando a = 3.3 y 
b = 0.0046, se obtuvo de la salida de computadora co¬ 
mo (0.217, 1.755). Obtenga un intervalo de confianza de 
95% para aaPb y cuando a = 3.3 y b = 0.0046. 

56. En un experimento para estudiar factores que influyen en la 
gravedad específica de la madera (“Anatomical Factors 
Influencing Wood Specific Gravity of Slash Pines and the 
Implications for the Development of a High-Quality Pulp- 
wood”, TAPPI, 1964: 401-404), se obtuvo una muestra de 
20 muestras de madera madura, y se tomaron medidas en el 
número de fibras/mm 2 en albura de primavera (x 3 ), número 
de fibras/mm 2 en albura de verano ( x 2 ), % de albura de pri¬ 


mavera (x 3 ), absorción de luz en albura de primavera (x 4 ) y 

absorción de luz en albura de verano (jc 5 ). 

a. El ajuste de la función de regresión = )3 0 + 

/3¡x¡ + ■ ■ ■ + (3 5 x¡ dio por resultado en R 2 = 0.769. 
¿Indican los datos que hay una relación lineal entre gra¬ 
vedad específica y al menos uno de los predictores? 
Pruebe usando ct = 0.01. 

b. Cuando x 2 se elimina del modelo, el valor de R 2 perma¬ 
nece en 0.769. Calcule una R 2 ajustada para el modelo 
completo y el modelo con x 2 eliminada. 

c. Cuando x¡, x 2 y x 4 se eliminan, el valor resultante de R 2 es 
0.654. La suma total de cuadrados es STC = 0.0196610. 
¿Sugieren los datos que x¡, x 2 y x 4 tienen coeficientes ce¬ 
ro en el modelo de regresión verdadero? Pruebe las hi¬ 
pótesis relevantes al nivel 0.05. 

d. La media y desviación estándar de x 3 fueron 52.540 y 
5.4447, respectivamente, mientras que las de x 5 fueron 
89.195 y 3.6660, respectivamente. Cuando se ajustó el 
modelo que comprende estas dos variables estandariza¬ 
das, la ecuación de regresión estimada fue y — 0.5255 — 
0.0236xj + 0.0097x5. ¿Qué valor de gravedad específica 
pronosticaría el lector para una muestra de madera con 
% de albura de primavera = 50 y % de absorción de luz 
en albura de verano = 90? 

e. La desviación estándar estimada del coeficiente estima¬ 
do jÓ 3 de x 3 , (es decir, para fi 3 del modelo estandarizado) 
fue 0.0046. Obtenga un intervalo de confianza de 95% 
para /S 3 . 

f. Usando la información de los incisos d) y e), ¿cuál es el 
coeficiente estimado de x 3 en el modelo no estandarizado 
(usando sólo predictores x 3 y x 5 ) y cuál es la desviación 
estándar estimada del estimador de coeficiente (es decir, 

para /S 3 en el modelo no estandarizado)? 

g. La estimación de a para el modelo de dos predictores es 
s = 0.02001, mientras que la desviación estándar esti¬ 
mada de)3 0 + P 3 x' 3 + 0¡x' 5 , cuando x 3 = -0.3747 y x' 5 = 
-0.2769 (es decir, cuando x 3 = 50.5 y x 5 = 88.9) es 
0.00482. Calcule un intervalo de predicción de 95% 
para gravedad específica cuando el % de albura de pri¬ 
mavera = 50.5 y el % de absorción de luz en albura de 
verano = 88.9. 
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57. En la tabla siguiente, se presenta la SCE más pequeña para 
cada número de predictores k (k = 1, 2, 3, 4) para un pro¬ 
blema de regresión en el que y = calor acumulativo de en¬ 
durecimiento en cemento, x¡ = % de aluminato tricálcico, 
x 2 — % de silicato tricálcico, x 2 = % de ferrato de aluminio 
y jc 4 = % de silicato dicálcico. 


Número de 


predictores k 

Predictor(as) 

SCE 

1 

*4 

880.85 

2 

x v x 2 

58.01 

3 

x lt x 2 , X 3 

49.20 

4 

x l9 x 2 , x 3 , x 4 

47.86 


Además, n = 13 y STC = 2715.76. 

a. Use los criterios estudiados en el texto para recomendar 
el uso de un modelo particular de regresión. 

b. ¿La selección directa produciría como el mejor modelo 
de dos predictores? Explique. 

58. El artículo “Creep and Fatigue Characteristics of Ferroce- 
ment Slabs” (J. Ferrocement, 1984: 309-322) reportó datos 
acerca de y = resistencia a la tensión (MPa), x¡ = grosor de 
losa (cm), x 2 — carga (kg), x 2 = duración de carga (días) y 
x 4 = tiempo bajo prueba (días) que resultan de pruebas de 
esfuerzo de n = 9 losas de concreto reforzado. Los resulta¬ 
dos de aplicar el método de eliminación El de selección de 
variable se resumen en el formato tabular siguiente. Expli¬ 
que qué ocurrió en cada uno de los pasos del procedimiento. 


Constante 

1 

2 

3 

de paso 

8.496 

12.670 

12.989 

x¡ 

-0.29 

-0.42 

-0.49 

RAZÓN T 

-1.33 

-2.89 

-3.14 

x 2 

0.0104 

0.0110 

0.0116 

RAZÓN T 

6.30 

7.40 

7.33 

*3 

0.0059 



RAZÓN T 

0.83 



*4 

-0.023 

-0.023 


RAZÓN T 

-1.48 

-1.53 


S 

0.533 

0.516 

0.570 

R-SQ 

95.81 

95.10 

92.82 


59. La opción de Mejor Regresión de MINITAB se utilizó en 
los datos de gravedad específica de madera del ejercicio 56, 
produciendo la siguiente salida de computadora. ¿Cuál(es) 
modelo(s) recomendaría el lector que se investigara en más 


detalle? 

Response is spgrav 






s 


% 


s 





p 

s 

s 

s 

u 





r 

u 

P 

P 

m 





n 

m 

r 

1 

1 





g 

r 

w 

t 

t 





f 

f 

o 

a 

a 


R-Sq 



i 

i 

o 

b 

b 

VarsR-Sq 

(adj ) 

c-p 

s 

b 

b 

d 

s 

s 

1 56.4 

53.9 

10.6 

0.021832 



X 



1 10.6 

5.7 

38.5 

0.031245 





X 

1 5.3 

0.1 

41.7 

0.032155 


X 





(continúa en la parte superior de la siguiente columna) 
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Response is 

spgrav 







2 

65.5 

61.4 

7.0 

0.019975 



X 


X 

2 

62.1 

57.6 

9.1 

0.020950 


X 

X 



2 

60.3 

55.6 

10.2 

0.021439 

X 


X 



3 

72.3 

67.1 

4.9 

0.018461 

X 


X 


X 

3 

71.2 

65.8 

5.6 

0.018807 



X 

X 

X 

3 

71.1 

65.7 

5.6 

0.018846 


X 

X 


X 

4 

77.0 

70.9 

4.0 

0.017353 

X 


X 

X 

X 

4 

74.8 

68.1 

5.4 

0.018179 


X 

X 

X 

X 

4 

72.7 

65.4 

6.7 

0.018919 

X 

X 

X 


X 

5 

77.0 

68.9 

6.0 

0.017953 

X 

X 

X 

X 

X 


60. La siguiente salida impresa de MINITAB resultó de aplicar 
el método de eliminación inversa, y el método de selección 
directa, a los datos de gravedad específica de madera de que 
trata el ejercicio 56. Para cada uno de los métodos, explique 
qué ocurrió en cada iteración del algoritmo. 


Response is spgrav on 5 predictors, 
with N = 2 0 


Step 

1 

2 

3 

4 

Constant 

0.4421 

0.4384 

0.4381 

0.5179 

sprngfib 

0.00011 

0.00011 

0.00012 


T-Value 

1.17 

1.95 

1.98 


sumrfib 

0.00001 




T-Value 

0.12 




%sprwood 

-0.00531 

-0.00526 

-0.00498 

-0.00438 

T-Value 

-5.70 

-6.56 

-5.96 

-5.20 

spltabs 

-0.0018 

-0.0019 



T-Value 

-1.63 

-1.76 



sumltabs 

0.0044 

0.0044 

0.0031 

0.0027 

T-Value 

3.01 

3.31 

2.63 

2.12 

S 

0.0180 

0.0174 

0.0185 

0.0200 

R-Sq 

77.05 

77.03 

72.27 

65.50 

Step 

1 

2 



Constant 

0.7585 

0.5179 



%sprwood 

-0.00444 

-0.00438 



T-Value 

-4.82 

-5.20 



sumltabs 


0.0027 



T-Value 


2.12 



S 

0.0218 

0.0200 



R-Sq 

56.36 

65.50 




61. Reconsidere los datos de gravedad específica de madera de 
que habla el ejercicio 56. Los siguientes valores de R 2 resul¬ 
taron de hacer regresión con cada predictor con los otros 
cuatro predictores (en la primera regresión, la variable de¬ 
pendiente era x¡ y los predictores fueron x 2 — x¡, etc.): 
0.628, 0.711, 0.341, 0.403 y 0.403. ¿La multicolinealidad 
parece ser un problema importante? Explique. 

62. Un estudio realizado para investigar la relación entre una 
variable de respuesta, que relaciona caídas de presión en 
una columna de burbujas de placa de filtros, y los predicto¬ 
res x 1 = velocidad superficial del fluido, x 2 = viscosidad 
del líquido y x¡ = medida de mallas, produjo los datos si¬ 
guientes (“A Correlation of Two-Phase Pressure Drops in 
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Datos para el ejercicio 62 


Observación 

Velocidad 

Viscosidad 

Medida de mallas 

Respuesta 

Residuo estandarizado 

K 

1 

2.14 

10.00 

0.34 

28.9 

2.01721 

0.202242 

2 

4.14 

10.00 

0.34 

26.1 

1.34706 

0.066929 

3 

8.15 

10.00 

0.34 

22.8 

0.96537 

0.274393 

4 

2.14 

2.63 

0.34 

24.2 

1.29177 

0.224518 

5 

4.14 

2.63 

0.34 

15.7 

-0.68311 

0.079651 

6 

8.15 

2.63 

0.34 

18.3 

0.23785 

0.267959 

7 

5.60 

1.25 

0.34 

18.1 

0.06456 

0.076001 

8 

4.30 

2.63 

0.34 

19.1 

0.13131 

0.074927 

9 

4.30 

2.63 

0.34 

15.4 

-0.74091 

0.074927 

10 

5.60 

10.10 

0.25 

12.0 

-1.38857 

0.152317 

11 

5.60 

10.10 

0.34 

19.8 

-0.03585 

0.068468 

12 

4.30 

10.10 

0.34 

18.6 

-0.40699 

0.062849 

13 

2.40 

10.10 

0.34 

13.2 

-1.92274 

0.175421 

14 

5.60 

10.10 

0.55 

22.8 

-1.07990 

0.712933 

15 

2.14 

112.00 

0.34 

41.8 

-1.19311 

0.516298 

16 

4.14 

112.00 

0.34 

48.6 

1.21302 

0.513214 

17 

5.60 

10.10 

0.25 

19.2 

0.38451 

0.152317 

18 

5.60 

10.10 

0.25 

18.4 

0.18750 

0.152317 

19 

5.60 

10.10 

0.25 

15.0 

-0.64979 

0.152317 


Screen-Plate Bubble Column”, Cañad. J. of Chem. Engr., 
1993: 460-463). Los residuos estandarizados y valores h¡¡ 
resultaron del modelo con sólo x¡, x 2 y x 3 como predictores. 
¿Hay algunas observaciones poco comunes? 

63. La salida de regresión múltiple de MINITAB, para los da¬ 
tos de hidrocarburos poliaromáticos (PAH) del ejercicio 53, 
incluyó la información siguiente: 

Unusual Observations 

Obs xl flth Fit SE Fit Residual St Resid 

6 243500 604.7 582.9 40.7 21.8 1.25X 

7 67793 27.7 139.3 12.3 -111.6 -2.62R 

R denotes an observation with a large standard- 
ized residual 

X denotes an observation whose X valué gives it 
large influence. 

¿Qué sugiere esto acerca de lo apropiado de usar la ecuación 
ajustada previamente dada como base para inferencias? Los 


investigadores en realidad eliminaron la observación # 7 e 
hicieron de nuevo una regresión. ¿Tiene sentido esto? 

64. Consulte los datos de descarga de agua dados en el ejerci¬ 
cio 55 y haga y = ln(ry), x¡ = ln(a) y x 2 = ln(¿>). Considere 
ajustar el modelo Y = /3 0 + /3 1 x l + f} 2 x 2 + e. 

a. Las h¡¡ resultantes son 0.138, 0.302, 0.266, 0.604, 0.464, 
0.360, 0.215, 0.153, 0.214 y 0.284. ¿Alguna de estas ob¬ 
servaciones parece ser influyente? 

b. Los coeficientes estimados son /3 0 = 1.5652, = 0.9450, 

j3, = 0.1815 y las correspondientes desviaciones estándar 
estimadas son = 0.7328, = 0.1528 y = 0.1752. 

El segundo residuo estandarizado es e* = 2.19. Cuando 
del conjunto de datos se omite de la segunda observa¬ 
ción, los coeficientes estimados resultantes son 
j8 0 = 1.8982, jS¡ = 1.025 y J3 2 = 0.3085. ¿Alguno de es¬ 
tos cambios indica que la segunda observación es influ¬ 
yente? 

c. La eliminación de la cuarta observación (¿por qué?) da 
j8 0 = 1.4592,& = 0.9850 y j3 2 = 0.1515. ¿Es influyen¬ 
te esta observación? 


EJERCICIOS SUPLEMENTARIOS (65-82) 


65. Se sabe que curar el concreto es vulnerable a vibraciones de 
choque, que pueden causar agrietamiento o daños ocultos al 
material. Como parte de un estudio de fenómenos de vibra¬ 
ción, el artículo “Shock Vibration Test of Concrete” (ACI 


Materials J., 2002: 361-370) informó de los datos siguien¬ 
tes acerca de la velocidad máxima de una partícula (mni/s) 
y la relación entre la velocidad ultrasónica de un pulso y la 
velocidad antes del impacto en prismas de concreto. 
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Obs 

vmp 

Relación 

Obs 

vmp 

Relación 

1 

160 

0.996 

16 

708 

0.990 

2 

164 

0.996 

17 

806 

0.984 

3 

178 

0.999 

18 

884 

0.986 

4 

252 

0.997 

19 

526 

0.991 

5 

293 

0.993 

20 

490 

0.993 

6 

289 

0.997 

21 

598 

0.993 

7 

415 

0.999 

22 

505 

0.993 

8 

478 

0.997 

23 

525 

0.990 

9 

391 

0.992 

24 

675 

0.991 

10 

486 

0.985 

25 

1211 

0.981 

11 

604 

0.995 

26 

1036 

0.986 

12 

528 

0.995 

27 

1000 

0.984 

13 

749 

0.994 

28 

1151 

0.982 

14 

772 

0.994 

29 

1144 

0.962 

15 

532 

0.987 

30 

1068 

0.986 


Aparecieron grietas transversales en los últimos 12 prismas, 
mientras que no se observó agrietamiento en los primeros 
18 prismas. 

a. Construya una gráfica de caja comparativa de la veloci¬ 
dad máxima de partículas (vmp) para los prismas agrie¬ 
tados y no agrietados y comente. A continuación estime 
la diferencia entre la vmp promedio verdadera para pris¬ 
mas agrietados y no agrietados en una forma que expre¬ 
se información acerca de la precisión y confiabilidad. 

b. Los investigadores ajustaron el modelo de regresión lineal 
simple a todo el conjunto de datos formado por 30 obser¬ 
vaciones, con la vmp como variable independiente y la re¬ 
lación como la variable dependiente. Utilice un paquete 
de software de estadística para ajustar varios modelos de 
regresión diferentes y obtenga inferencias apropiadas. 

66. Los autores del artículo “Long-Term Effects of Cathodic 
Protection on Prestressed Concrete Structures” ( Corrosión, 
1997: 891-908) presentó una gráfica de puntos de y = flu¬ 
jo de permeabilidad a estado estable (juA/cm 2 ) en función 
de x = grosor inverso de hoja metálica (cm -1 ); la curva 
lineal sustancial se usó como base para una importante con¬ 
clusión acerca del comportamiento del material. A conti¬ 
nuación aparece la salida de MINITAB del ajuste del 
modelo de regresión lineal simple a los datos. 

The regression equation is 
flux =-0.398 + 0.260 invthick 


Predictor 

Coef Stdev t 

-ratio 

P 

Constant 

-0.3982 0. 

5051 

-0.79 

0.460 

invthick 

0.26042 0.01502 

17.34 

0.000 

s = 0.4506 

R-sg = 98.0% 

R-sq(adj) 

= 97.7% 


Analysis of Variance 




Source 


DF SS 

MS 

F 

P 

Regression 

1 61.050 

61.050 

300.64 

0.000 

Error 


6 1.218 

0.203 



Total 


7 62.269 





inv- 


Stdev. 


st. 

Obs. 

thick flux Fit 

Fit Residual 

Resid 

1 

19.8 4.3 4.758 

0.242 

-0.458 

-1.20 

2 

20.6 5.6 4.966 

0.233 

0.634 

1.64 

3 

23.5 6.1 5.722 

0.203 

0.378 

0.94 

4 

26.1 6.2 6.399 

0.182 

-0.199 

-0.48 


(continúa en la parte superior de la siguiente columna ) 
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inv¬ 



Stdev. 


St. 

Obs . 

thick 

flux 

Fit 

Fit 

Residual 

Resid 

5 

30.3 

6.9 

7.493 

0.161 

-0.593 

-1.41 

6 

43.5 

11.2 

10.930 

0.236 

0.270 

0.70 

7 

45.0 

11.3 

11.321 

0.253 

-0.021 

-0.06 

8 

46.5 

11.7 

11.711 

0.271 

-0.011 

-0.03 


a. Interprete la pendiente estimada y el coeficiente de deter¬ 
minación. 

b. Calcule una estimación puntual del flujo promedio ver¬ 
dadero cuando el grosor inverso de la hoja metálica sea 
de 23.5. 

c. ¿Parece útil el modelo? 

d. Pronostique el flujo cuando el grosor inverso es 45 de 
modo que exprese información acerca de la precisión y 
la confiabilidad. 

e. Investigue lo adecuado del modelo. 

67. El artículo “Validation of the Rockport Fitness Walking 
Test in College Males and Females” (Research Quarterly 
for Exercise and Sport, 1994: 152-158) recomendó la si¬ 
guiente ecuación de regresión estimada para relacionar y = 
VCLmáx (1/min, una medida de la salud cardiorrespiratoria) 
con las pronosticadoras x¡ = género (femenino = 0, 
masculino = 1), x 2 = peso (Ib), x 3 = tiempo para recorrer 
1 milla (min) y x A = ritmo cardiaco al final de la caminata 
(pulsaciones /min) 

y = 3.5959 + 0.6566-Vj + 0.0096.v 2 

- 0.0996x3 “ 0.0080 x 4 

a. ¿Cómo interpretaría el coeficiente estimado ¡3 3 = 
-0.0996? 

b. ¿Cómo interpretaría el coeficiente estimado /3j = 0.6566? 

c. Suponga que los datos de un hombre cuyo peso fue de 
170 Ib, con tiempo de caminata de 11 minutos y ritmo 
cardiaco de 140/min, produjo un V0 2 máx = 3.15. ¿Qué 
pronosticaría el lector para V0 2 máx en esta situación y 
cuál es el valor del residuo correspondiente? 

d. Usando SCE = 30.1033 y STC = 102.3922, ¿qué pro¬ 
porción de variación observada en V0 2 máx se puede 
atribuir a la relación con el modelo? 

e. Suponiendo un tamaño muestral de n = 20, realice una 
prueba de las hipótesis para determinar si el modelo se¬ 
leccionado especifica una relación útil entre V0 2 máx y 
al menos uno de los predictores. 

68. El reconocimiento de características de modelos de superfi¬ 
cie de piezas complicadas se está haciendo cada vez más 
importante en el desarrollo de eficientes sistemas de diseño 
asistido por computadora (CAD). El artículo “A Compu- 
tationally Efficient Aproach to Feature Abstraction in De- 
sign-Manufacturing Integration” (J. of Engr. for Industry, 
1995: 16-27) contenía una gráfica de log 10 (tiempo total 
de reconocimiento), con tiempo en segundos, en función de 
log 10 (número de aristas de una pieza), de la cual se leyeron 
los siguientes valores representativos: 


Log(aristas) 

1.1 

1.5 

1.7 

1.9 

2.0 

2.1 

Log(tiempo) 

0.30 

0.50 

0.55 

0.52 

0.85 

0.98 

Log(aristas) 

2.2 

2.3 

2.7 

2.8 

3.0 

3.3 

Log(tiempo) 

1.10 

LOO 

1.18 

1.45 

1.65 

1.84 

Log(aristas) 

3.5 

3.8 

4.2 

4.3 



Log(tiempo) 

2.05 

2.46 

2.50 

2.76 
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564 CAPITULO 13 Regresión múltiple y no lineal 

a. ¿Una gráfica de puntos de log(tiempo) en función de 
log(aristas) sugiere una relación lineal aproximada entre 
estas dos variables? 

b. ¿Qué modelo probabilístico para relacionar y = tiempo 
de reconocimiento con x = número de aristas está insi¬ 
nuado por la relación de regresión simple entre las varia¬ 
bles transformadas? 

c. Las cantidades calculadas en resumen a partir de los da¬ 
tos son 

n = 16 = 42.4 £y’ = 21.69 

X(*,') 2 = 126.34 ’Z(y'i ) 2 = 38.5305 

'Zx' ¡ y'¡ = 68.640 

Calcule estimaciones de los parámetros para el modelo del 
inciso b) y a continuación obtenga una predicción puntual 
del tiempo cuando el número de aristas sea de 300. 

69. La presión de aire (libra por pulgada cuadrada) y la tempe¬ 
ratura (°F) se midieron para un proceso de compresión de 
cierto aparato de émbolo y cilindro y produjeron los datos 
siguientes (de Introduction to Engineering Experimenta- 


don, Prentice- 

Hall, Inc. 

, 1996, p. 

153): 



Presión 

20.0 

40.4 

60.8 

80.2 

100.4 

Temperatura 

44.9 

102.4 

142.3 

164.8 

192.2 

Presión 

120.3 

141.1 

161.4 

181.9 

201.4 

Temperatura 

221.4 

228.4 

249.5 

269.4 

270.8 

Presión 

220.8 

241.8 

261.1 

280.4 

300.1 

Temperatura 

291.5 

287.3 

313.3 

322.3 

325.8 

Presión 

320.6 

341.1 

360.8 



Temperatura 

337.0 

332.6 

342.9 




a. ¿Ajustaría el lector el modelo de regresión lineal simple a 
los datos y lo usaría como base para pronosticar la tempe¬ 
ratura a partir de la presión? ¿Por qué sí o por qué no? 

b. Encuentre un modelo probabilístico apropiado y, del 
modo más informativo posible, úselo como base para 
predecir el valor de temperatura que resultaría de una pre¬ 
sión de 200. 

70. Un estudiante de ingeniería aeronáutica realizó un experi¬ 
mento, para estudiar en qué forma la relación y = sustenta¬ 
ción/resistencia al avance, relacionada con las variables 
Xj = posición de cierta superficie elevadora hacia adelante 
respecto al ala principal y x, = posición de la cola con res¬ 
pecto al ala principal; obtuvo los datos siguientes (Statistics 
for Engineering Problem Solving, p. 133): 


'i (pulgadas) 

x 2 (pulgadas) 


-1.2 

-1.2 

0.858 

-1.2 

0 

3.156 

-1.2 

1.2 

3.644 

0 

-1.2 

4.281 

0 

0 

3.481 

0 

1.2 

3.918 

1.2 

-1.2 

4.136 

1.2 

0 

3.364 

1.2 

1.2 

4.018 


y = 3.428, STC = 8.55 


a. El ajuste del modelo de primer orden da SCE = 5.18, 
mientras que incluir x 3 = XjX 2 como predictor produce 
SCE = 3.07. Calcule e interprete el coeficiente de deter¬ 
minación múltiple para cada modelo. 

b. Efectúe una prueba de utilidad de modelo usando a = 
0.05 para cada uno de los modelos descritos en el inci¬ 
so a). ¿Le sorprende cualquiera de los dos resultados? 

71. Un baño de amoniaco es el más utilizado para depositar ca¬ 
pas de aleación de Pd-Ni. El artículo “Modelling of Palla- 
dium and Nickel in an Ammonia Bath in a Rotary Device” 
(Plating and Surface Finishing , 1997: 102-104) informó 
de una investigación sobre la forma en que las característi¬ 
cas de la composición del baño afectan las propiedades de 
la capa. Tenga en cuenta los siguiente datos en x¡ = concen¬ 
tración de Pd (g/dnr 3 ), x 2 = concentración de Ni(g/dm 3 ), 
x 3 = pH, x 4 = temperatura (°C), x 5 = densidad de corriente 
catódica (A/dm 2 ) y y = contenido de paladio (%) de la capa. 


Obs 

pdconc 

niconc 

pH 

temp 

currdens 

pallcont 

1 

16 

24 

9.0 

35 

5 

61.5 

2 

8 

24 

9.0 

35 

3 

51.0 

3 

16 

16 

9.0 

35 

3 

81.0 

4 

8 

16 

9.0 

35 

5 

50.9 

5 

16 

24 

8.0 

35 

3 

66.7 

6 

8 

24 

8.0 

35 

5 

48.8 

7 

16 

16 

8.0 

35 

5 

71.3 

8 

8 

16 

8.0 

35 

3 

62.8 

9 

16 

24 

9.0 

25 

3 

64.0 

10 

8 

24 

9.0 

25 

5 

37.7 

11 

16 

16 

9.0 

25 

5 

68.7 

12 

8 

16 

9.0 

25 

3 

54.1 

13 

16 

24 

8.0 

25 

5 

61.6 

14 

8 

24 

8.0 

25 

3 

48.0 

15 

16 

16 

8.0 

25 

3 

73.2 

16 

8 

16 

8.0 

25 

5 

43.3 

17 

4 

20 

8.5 

30 

4 

35.0 

18 

20 

20 

8.5 

30 

4 

69.6 

19 

12 

12 

8.5 

30 

4 

70.0 

20 

12 

28 

8.5 

30 

4 

48.2 

21 

12 

20 

7.5 

30 

4 

56.0 

22 

12 

20 

9.5 

30 

4 

77.6 

23 

12 

20 

8.5 

20 

4 

55.0 

24 

12 

20 

8.5 

40 

4 

60.6 

25 

12 

20 

8.5 

30 

2 

54.9 

26 

12 

20 

8.5 

30 

6 

49.8 

27 

12 

20 

8.5 

30 

4 

54.1 

28 

12 

20 

8.5 

30 

4 

61.2 

29 

12 

20 

8.5 

30 

4 

52.5 

30 

12 

20 

8.5 

30 

4 

57.1 

31 

12 

20 

8.5 

30 

4 

52.5 

32 

12 

20 

8.5 

30 

4 

56.6 


a. Ajuste el modelo de primer orden con los cinco predic- 
tores y evalúe su utilidad. ¿Todos los predictores pare¬ 
cen importantes? 

b. Ajuste el modelo completo de segundo orden y evalúe 
su utilidad. 

c. El grupo de predictores de segundo orden (de interac¬ 
ción y cuadráticos), ¿parece dar más información acerca 
de y de aquella con la que contribuyen los predictores de 
primer orden? Realice una prueba apropiada de las hipó¬ 
tesis. 

d. Los autores del artículo citado recomendaron el uso de 
los cinco predictores de primer orden más el predictor 
adicional x 6 = (pH) 2 . Ajuste este modelo. ¿Los seis pre¬ 
dictores parecen importantes? 
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72. El artículo “An Experimental Study of Resistance Spot 
Welding in 1 mm Thick Sheet of Low Carbón Steel” (7. of 
Engr. Manufacture, 1996: 341-348) examinó un análisis es¬ 
tadístico cuyo objetivo básico era establecer una relación 
que pudiera explicar la variación en resistencia de soldadu¬ 
ras (y), al relacionar la resistencia con las características del 
proceso como son corriente de soldadura (es), tiempo de 
soldadura (ts), y fuerza del electrodo (fe). 

a. STC = 16.18555 y el ajuste del modelo completo de se¬ 
gundo orden dio SCE = 0.80017. Calcule e interprete el 
coeficiente de determinación múltiple. 

b. Suponiendo que n = 37, efectúe una prueba de utilidad 
del modelo (la tabla ANOVA del artículo indica que 
n — (k + 1) = 1, pero otra información dada contradice 
esto y es consistente con el tamaño muestral sugerido). 

c. La relación F dada para la interacción entre corriente y 
tiempo fue de 2.32. Si todo¡s los predictores se retienen 
en el modelo, ¿puede eliminarse este predictor de interac¬ 
ción? [Sugerencia: Al igual que en regresión lineal sim¬ 
ple, una relación F para un coeficiente es el cuadrado de 
su razón t.[ 

d. Los autores propusieron eliminar dos predictores de in¬ 
teracción y un predictor cuadrático y recomendaron la 
ecuación estimada y = 3.352 0.098cs + 0.222ts + 
0.297fe - 0.0102(ts) 2 - 0.037(fe) 2 + 0.0128(cs)(ts). 
Considere una comente de soldadura de 10 kA, un tiempo 
de soldadura de 12 ciclos de ca, y una fuerza de electro¬ 
do de 6 kN. Suponiendo que la desviación estándar esti¬ 
mada de la resistencia pronosticada en esta situación sea 
0.0750, calcule un intervalo de predicción de 95% para 
la resistencia. ¿El intervalo sugiere que el valor de la re¬ 
sistencia pueda pronosticarse con precisión? 

73. La información siguiente sobre x = frecuencia (MHz) y 
y = potencia de salida (W), para cierto tipo de configura¬ 
ción láser, apareció en una gráfica del artículo “Frequency 
Dependence in RF Discharge Excited Waveguide C0 2 La- 
sers” {IEEE J. Quantum Electronics, 1984: 509-514). 


X 

60 

63 

77 

100 

125 

157 

186 

222 

y 

16 

17 

19 

21 

22 

20 

15 

5 


Un análisis computarizado dio la siguiente información 
para un modelo de regresión cuadrático: /3 0 = -1.5127, 
/3 X = 0.391901, ]8 2 = -0.00163141, = 0.00003391, 

SCE = 0.29, STC = 202.88 y íj) = 0.1141 2 cuando x = 100. 

a. ¿El modelo cuadrático parece apropiado para explicar la 
variación observada en potencia de salida al relacionar¬ 
la con la frecuencia? 

b. El modelo de regresión lineal simple ¿sería casi tan sa¬ 
tisfactorio como el modelo cuadrático? 

c. ¿Piensa usted que valdría la pena considerar un modelo 
cúbico? 

d. Calcule un intervalo de confianza de 95% para salida es¬ 
perada de potencia cuando la frecuencia es de 100. 

e. Use un intervalo de predicción de 95% para predecir la 
potencia desde una sola carrera experimental cuando 
la frecuencia es de 100. 

74. La conductividad es una importante característica del vi¬ 
drio. El artículo “Structure and Properties of Rapidly Quen- 


ched Li 2 0-Al 2 0-Nb 2 0 5 Glasses” ( J. Amer. Ceramic Soc., 
1983: 890-892) informa de los datos siguientes acerca del 
contenido de x = Li 2 0 de cierto tipo de vidrio y y = con¬ 
ductividad a 500 K. 


X 

19 

20 

24 

27 

29 

30 

y 

l 0 -8.° 

io- 71 

ío- 7 - 2 

IO- 6. 7 

10“ 62 

1QHÍ.8 


X 

31 

39 

40 

43 

45 

50 

y 

10-5.8 

10- 53 

10-ó.q 

IO - 4 . 7 

IO- 5. 4 

10“ 51 


(Éste es un subconjunto de los datos que aparecieron en el 
artículo.) Proponga un modelo apropiado para relacionar y 
con x, estimar los parámetros del modelo y predecir la con¬ 
ductividad cuando el contenido de Li 2 0 es de 35. 

75. El efecto del manganeso (Mn) en el crecimiento del trigo se 
examina en el artículo ‘‘Manganese Deficiency and Toxicity 
Effects on Growth, Development and Nutrient Composition 
in Wheat” {Agronomy J., 1984: 213-217). Se utilizó un mo¬ 
delo de regresión cuadrático para relacionar y = altura de la 
planta (cm) con x = log 10 (Mn agregado), con ¿iM como las 
unidades para el Mn agregado. La información siguiente 
apareció en una gráfica de puntos del artículo. 


X 

- 1.0 

-0.4 

0 

0.2 

1.0 

y 

32 

37 

44 

45 

46 


X 

2.0 

2.8 

3.2 

3.4 

4.0 

y 

42 

42 

40 

37 

30 


Además, J3 0 = 41.7422, j3j = 6.581, j3 2 = -2.3621, = 

0.8522, = 1.002, = 0.3073 y SCE = 26.98. 

a. ¿Es útil el modelo cuadrático para describir la relación 
entre x y y? [Sugerencia: La regresión cuadrática es un 
caso especial de regresión múltiple con k = 2, x¡ = x y 
x 2 = x 2 .] Aplique un procedimiento apropiado. 

b. ¿Debe eliminarse el predictor cuadrático? 

c. Estime la altura esperada para el trigo tratado con 10 
¿iM de Mn usando un intervalo de confianza de 90%. 
[Sugerencia: La desviación estándar estimada de /3 0 + 
/3¡ + jS-> es 1.031]. 

76. El artículo “Chemithermomechanical Pulp from Mixed 
High Density Hardwoods” (TAPPI, julio 1988: 145-146) 
informa de un estudio en el que se obtuvo la información si¬ 
guiente para relacionar y = área superficial específica 
(cm 3 /g) con x 1 — % de NaOH utilizado como sustancia quí¬ 
mica de tratamiento previo y x 2 = tiempo de tratamiento 
(min) para un lote de pulpa. 


*i *2 y 


3 

30 

5.95 

3 

60 

5.60 

3 

90 

5.44 

9 

30 

6.22 

9 

60 

5.85 

9 

90 

5.61 

15 

30 

8.36 

15 

60 

7.30 

15 

90 

6.43 
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La siguiente salida de MINITAB resultó de una petición pa¬ 
ra ajustar el modelo Y = J3 0 + fi l x 1 + fi 2 x 2 + e. 

The regression equation is 

AREA = 6.05 + 0.142 NAOH - 0.0169 TIME 


Predictor Coef 
Constant 6.0483 
NAOH 0.14167 
TIME -0.016944 


Stdev t-ratio 

0.5208 11.61 

0.03301 4.29 

0.006601 -2.57 


P 

0.000 

0.005 

0.043 


s = 0.4851 R-sg = 80.7% 
Analysis of Variance 


SOURCE 

Regression 

Error 

Total 


DF SS 

2 5.8854 

6 1.4118 

8 7.2972 


R-sq (adj) 74.2% 


MS F p 
2.9427 12.51 0.007 
0.2353 


a. ¿Qué proporción de variación observada en área super¬ 
ficial específica puede ser explicada por la relación del 
modelo? 

b. ¿El modelo seleccionado parece especificar una relación 
útil entre la variable dependiente y los predictores? 

c. Siempre que el % de NaOH permanezca en el modelo, 
¿sugeriría usted que se eliminara el tiempo de tratamien¬ 
to de los predictores? 

d. Calcule un intervalo de confianza de 95% para el cam¬ 
bio esperado en el área superficial específica asociado 
con un aumento de 1% en NaOH, cuando el tiempo de 
tratamiento se mantiene fijo. 

e. MINITAB reportó que la desviación estándar estimada 
de 0 O + J3j(9) + 0 2 (6O) es 0.162. Calcule un intervalo de 
predicción para el valor del área superficial específica a 
observar cuando el % de NaOH = 9 y el tiempo de tra¬ 
tamiento = 60. 

77. Se realizó un análisis de regresión múltiple para relacionar 
y = resistencia a la tensión de un espécimen de fibra sinté¬ 
tica con las variables x¡ = porcentaje de algodón y x 2 = 
tiempo de secado. El conjunto de datos estuvo formado por 
n = 12 observaciones. 

a. Los coeficientes estimados fueron 0 O = 180.00, 0 1 = 
1.000 y 0 2 — 10.500. Calcule una estimación puntual de 
la resistencia a la tensión esperada cuando el porcentaje 
de algodón = 15 y el tiempo de secado = 3.5. 

b. Las sumas de cuadrados fueron STC = 1210.30 y SCE 
= 117.40. ¿Qué proporción de variación observada en 
resistencia a la tensión se puede atribuir a la relación del 
modelo? 

c. Use la información del inciso b) para determinar si el 
modelo con variables x l y x 2 especifica una relación útil. 

d. La desviación estándar estimada de 0 O + 0 l x l + 0 2 x 2 
cuando x¡ = 18 y x 2 = 3.0 fue de 1.20. Calcule un inter¬ 
valo de predicción de 95% para la resistencia a la ten¬ 
sión de un espécimen de tejido para el que x 1 = 18 y 
x 2 = 3.0. 

78. Se realizó un estudio para relacionar el tiempo para falla (y) 
de cierto componente de una máquina con las variables de 
voltaje de operación Cyj), velocidad del motor (x 2 ) y tempe¬ 
ratura de operación (x 3 ). El conjunto de datos resultante es¬ 
tuvo formado por n = 20 observaciones. Cuando el modelo 
con las tres variables x¡, x 2 y x 3 se ajustó a la información, 
el valor de la suma de error de cuadrados fue de 8212.5. El 
ajuste del modelo de interacción de segundo orden (con 


predictores cuadráticos y todos los productos de pares de 
variables) dio una suma de error de cuadrados de 5027.1. 
¿Debe retenerse en el modelo al menos uno de los predic¬ 
tores cuadráticos o de interacción? Exprese y pruebe las hi¬ 
pótesis relevantes. 

79. El artículo “A Statistical Analysis of the Notch Toughness of 
9% Nickel Steels Obtained from Production Heats” (J. of 
Testing and Exal., 1987: 355-363) informa de los resultados 
de un análisis de regresión múltiple que relaciona la resisten¬ 
cia Charpy de canal V y (en joules) con las siguientes varia¬ 
bles: x¡ = grosor de placa (mm), x 2 = contenido de carbono 
(%), x 3 = contenido de manganeso (%), x 4 = contenido de 
fósforo (%), x 5 = contenido de azufre (%), x 6 = contenido 
de silicio (%), x-¡ — contenido de níquel (%), x 8 = punto de 
ruptura (Pa) y x 9 = resistencia a la tensión (Pa). 
a. Los mejores subconjuntos posibles involucraron sumar 
variables en el orden x 5 , x 8 , x 6 , x 3 , x ,, jc 7 , x g , x 3 y x 4 . Los 
valores de R\, CME^ y C k son como sigue: 

Núm. de 


predictores 

1 

2 

3 

4 


R\ 

0.354 

0.453 

0.511 

0.550 


CME k 

2295 

1948 

1742 

1607 


c k 

314 

173 

89.6 

35.7 


Núm. de 
predictores 

5 

6 

7 

8 

9 

R\ 

0.562 

0.570 

0.572 

0.575 

0.575 

CME A 

1566 

1541 

1535 

1530 

1532 

c k 

19.9 

11.0 

9.4 

8.2 

10.0 


¿Qué modelo recomendaría el lector? Explique la justi¬ 
ficación de su elección. 

b. Los autores también consideraron modelos de segundo 
orden que comprendían predictores x\y x¡x¡. La informa¬ 
ción sobre los mejores de estos modelos, comenzando 
con las variables x 2 , x 3 , x¡, x 6 , x 7 y x 8 es como sigue (al 
pasar del mejor modelo de cuatro predictores al mejor 
modelo de cinco predictores, x 8 se eliminó y se introdu¬ 
jeron ryrj y x 7 x 8 ; x s se volvió a introducir en una etapa 
posterior): 


Num. de 
predictores 

1 

2 

3 

4 

5 

R¡ 

0.415 

0.541 

0.600 

0.629 

0.650 

CME k 

2079 

1636 

1427 

1324 

1251 

c k 

433 

109 

104 

52.4 

16.5 

Num. de 
predictores 

6 

7 

8 

9 

10 

R\ 

0.652 

0.655 

0.658 

0.659 

0.659 

cme a 

1246 

1237 

1229 

1229 

1230 

C k 

14.9 

11.2 

8.5 

9.2 

11.0 


¿Cuál de estos modelos recomendaría el lector, y por qué? 
[Nota: Los modelos basados en ocho de las variables origi¬ 
nales no dio una mejoría marcada sobre aquellas bajo con¬ 
sideración aquí.] 
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80. Se seleccionó una muestra de n = 20 compañías, y los va¬ 
lores de y = precio de acción y k = 15 variables predicto- 
res (por ejemplo dividendos trimestrales, utilidades del año 
previo y relación de deuda) se determinaron. Cuando el mo¬ 
delo de regresión simple que utilizó estos 15 predictores se 
ajustó a los datos, resultó R 2 = 0.90. 

a. ¿El modelo parece especificar una relación útil entre y 
y variables predictores? Efectúe una prueba usando ni¬ 
vel de significación 0.05. [Sugerencia: El valor crítico F 
para grado de libertad de numerador 15 y denominador 
4 es 5.86.] 

b. Con base en el resultado del inciso a), ¿el valor de R 2 im¬ 
plica por sí mismo que un modelo es útil? ¿Bajo qué cir¬ 
cunstancias podría sospecharse de un modelo con un 
alto valor de R 2 7 

c. Con n y k como se dan previamente, ¿qué tan grande 
tendría que ser R 2 para que el modelo sea juzgado como 
útil al nivel de significación 0.05? 

81. ¿La exposición a la contaminación del aire provoca una me¬ 
nor esperanza de vida? Esta pregunta se examinó en el artícu¬ 
lo “Does Air Pollution Shorten Lives? ( Statistics and Public 
Policy, Reading, MA. Addison-Wesley, 1977). Los datos 
sobre 

y = porcentaje total de mortalidad (muertes por 10 000) 
x¡ = lectura media de partículas suspendidas (/Ltg/m 3 ) 
x 2 = lectura más baja de sulfato ([ju,g/m 3 )] X 10) 

* 3 = densidad de población (personas/milla 2 ) 

* 4 = (porcentaje no de raza blanca) X 10 
x 5 = (porcentaje de más de 65 años) X 10 
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para el año 1960 se registraron para n = 117 áreas estadís¬ 
ticas metropolitanas estándar seleccionadas al azar. La 
ecuación de regresión estimada fue 

y = 19.607 + 0.041.*! + 0.071* 2 
+ 0.001*3 + 0.041*4 + 0-687*5 

a. Para este modelo, R 2 = 0.827. Usando un nivel de sig¬ 
nificación de 0.05, efectúe una prueba de utilidad del 
modelo. 

b. La desviación estándar estimada de fue de 0.16. 
Calcule e interprete un intervalo de confianza de 90% 
para fí 1 . 

c. Dado que la desviación estándar estimada para es 
0.07, determine si el porcentaje que no sea de raza blan¬ 
ca es una variable importante en el modelo. Utilice un 
nivel de significación de 0.1. 

d. En 1960, los valores de *,, *,, * 3 , * 4 y * 5 para Pittsburgh 
fueron de 166, 60, 788, 68 y 95, respectivamente. Utili¬ 
ce la ecuación de regresión dada para predecir la tasa de 
mortalidad de Pittsburgh. ¿Cómo se compara la predic¬ 
ción del lector con el valor real de 1960 de 103 muertes 
por 10 000? 

Dado que R 2 = 0.723 para el modelo que contiene los pre¬ 
dictores *!, * 4 , * 5 y * 8 y R 2 — 0.689 para el modelo con 
predictores x 1 , * 3 , * 5 y * 6 , ¿qué se puede decir acerca de R 2 
para el modelo que contiene los predictores 

a. *j, * 3 , * 4 , * 5 , * 6 y * 8 ? Explique. 

b. *! y * 4 ? Explique. 
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Pruebas de bondad 
de ajuste y análisis de 
datos categóricos 


INTRODUCCIÓN 

En el tipo más sencillo de situación considerado en este capítulo, cada observación en 
una muestra se clasifica como perteneciente a uno de un número finito de catego¬ 
rías (por ejemplo, el tipo de sangre podría ser una de cuatro categorías O, A, B o AB). 
Con p, se denota la probabilidad de que cualquier observación particular pertenece 
a la categoría i (o a la proporción de la población que pertenece a la categoría /), se 
desea probar una hipótesis nula que satisfaga por completo los valores de todas las 
p¡ (por ejemplo H 0 : p , = 0.45, p 2 = 0.35, p 3 = 0.1 5, p 4 = 0.05, cuando hay cuatro 
categorías). El estadístico de prueba será una medida de la discrepancia entre los nú¬ 
meros observados de las categorías y los números esperados cuando H 0 es verda¬ 
dera. Debido a que se llegará a una decisión al comparar el valor calculado del es¬ 
tadístico de prueba en función de un valor crítico de la distribución ji cuadrada, el 
procedimiento recibe el nombre de prueba de bondad de ajuste ji cuadrada. 

A veces la hipótesis nula especifica que las p¡ dependen de algún número más 
pequeño de parámetros sin especificar los valores de estos parámetros. Por ejemplo, 
con tres categorías la hipótesis nula podría indicar que p, = 6 2 , p 2 = 20(1 -9) y 
p 3 = (1 - 9) 2 . Para efectuar una prueba ji cuadrada, los valores de cualesquier pará¬ 
metros no especificados deben estimarse a partir de datos muéstrales. Estos proble¬ 
mas se estudian en la sección 14.2. Los métodos se aplican entonces para probar una 
hipótesis nula que exprese que la muestra proviene de una familia particular de dis¬ 
tribuciones, como la familia Poisson (con A estimada desde la muestra) o la familia 
normal (con ¿u, y a estimadas). 

Las pruebas ji cuadrada para dos situaciones diferentes se presentan en la sec¬ 
ción 14.3. En la primera, la hipótesis nula expresa que las p, son iguales para varias 
poblaciones diferentes. El segundo tipo de situación comprende el tomar una muestra 
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de una población individual y clasificar cada individuo con respecto a dos factores ca¬ 
tegóricos diferentes (por ejemplo, la preferencia religiosa y registro de partido políti¬ 
co). La hipótesis nula en esta situación es que los dos factores son independientes 
dentro de la población. 


14.1 Pruebas de bondad de ajuste cuando las probabilidades 
categóricas se satisfacen por completo 

i_ 



Un experimento binomial consiste en una secuencia de intentos independientes en la que ca¬ 
da intento puede resultar en uno de dos posibles resultados, E (por éxito) y F (por fracaso). 
La probabilidad de éxito, denotada por p, se supone constante de un intento a otro, y el 
número n de intentos se fija al principio del experimento. En el capítulo 8 se presenta una 
prueba z de muestra grande para probar H 0 : p = p 0 . Note que esta hipótesis nula especifica 
P(E) y P(F), porque si P(E) = p 0 , entonces P(F) = 1 — p 0 . Si se denota P(F) por q y 
1 — p 0 por q 0 , la hipótesis nula se puede escribir alternativamente como H 0 : p = p 0 , q = q 0 . 
La prueba z es de dos colas cuando la alternativa de interés es p =f= p 0 . 

Un experimento multinomial generaliza un experimento binomial al permitir que ca¬ 
da intento resulte en uno de k posibles resultados, donde k> 2. Por ejemplo, suponga que 
una tienda acepta tres tipos diferentes de tarjetas de crédito. Un experimento multinomial 
resultaría de observar el tipo de tarjeta de crédito que utiliza, ya sea tipo 1, tipo 2 o tipo 3, 
cada uno de los siguientes n clientes que pagan con tarjeta de crédito. En general, nos refe¬ 
riremos a los k posibles resultados en la categoría i. Si el experimento consiste en selec¬ 
cionar n individuos u objetos de una población y clasificar cada uno, entonces p i es la 
proporción de la población que cae en la í-ésima categoría (un experimento como éste 
será aproximadamente multinomial siempre que n sea mucho menor que el tamaño de la 
población). 

La hipótesis nula de interés especificará el valor de cada p¡. Por ejemplo, en el caso 
de k = 3, se podría tener H 0 : p l = 0.5, p 2 = 0.3, //-, = 0.2. La hipótesis alternativa indicará 
que H 0 no es verdadera, es decir, que al menos una de la p¡ tiene un valor diferente de lo ex¬ 
presado por H 0 (en cuyo caso al menos dos deben ser distintas, porque deben sumar 1). El 
símbolo p j0 representará el valor de p¡ indicado por la hipótesis nula. En el ejemplo que aca¬ 
bamos de ver, p l0 = 0.5, p 20 = 0.3 y p 30 = 0.2. 

Antes de llevar a cabo el experimento multinomial, el número de intentos que da por 
resultado la categoría i (i = 1, 2,. .., o k) es una variable aleatoria, en la misma forma que 
el número de éxitos y el número de fracasos en un experimento binomial son variables alea¬ 
torias. Esta variable aleatoria estará denotada por N¡ y su valor observado por n¡. En vista 
que cada intento da por resultado exactamente una de las k categorías, XN¡ = n, y lo mismo 
resulta cierto para las n¡. Como ejemplo, un experimento con n = 100 y k = 3 podría dar 
Aj = 46, N 2 = 35 y N 3 =19. 

El número esperado de éxitos y el número esperado de fracasos en un experimento 
binomial son np y nq, respectivamente. Cuando H 0 : p = p 0 , q = q 0 es verdadera, los núme¬ 
ros esperados de éxitos y fracasos son np 0 y nq 0 , respectivamente. Del mismo modo, en un 
experimento multinomial el número esperado de intentos que resulte en la categoría i es E(N t ) 
= np¡(i = 1 ,,k). Cuando H 0 : p 1 = p l0 , ... ,p k = p w es verdadera, estos valores espera¬ 
dos se convierten en £(A[) = np l0 , E(N -,) = np 20 ,..., E(N¡) = np w . Para el caso en que k = 3, 
H 0 : Pl = 0.5, p 2 = 0.3, p 3 = 0.2 y n = i00, £(A,) = 100(0.5) = 50, E(N 2 ) = 30 y E(N 3 ) = 20 
cuando H 0 es verdadera. Entonces es frecuente que las n¡ se presenten en formato tabular 
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formado por una fila de celdas k, una de cada categoría, como se ilustra en la tabla 14.1. Los 
valores esperados cuando H 0 es verdadera se muestran justo debajo de los valores observa¬ 
dos. Las N¡ y las n¡ suelen llamarse cantidades de celda observadas (o frecuencias de celda 
observadas ), y np l0 , np 20 ,. . . , np M son las correspondientes cantidades de celda esperadas 
bajo H 0 . 


Tabla 14.1 Cantidades de celda observadas y esperadas 


Categoría 

1=1 

i = 2 

i = k 

Total de fila 

Observada 

«1 

n 2 


»k 

n 

Esperada 

"Pío 

"P20 


n PkO 

n 


Las n¡ deben ser razonablemente cercanas a las correspondientes np j0 cuando H 0 es 
verdadera. Por otra parte, varias de las cantidades observadas deben diferir en forma consi¬ 
derable de estas cantidades esperadas cuando los valores reales de las p¡ difieran marcada¬ 
mente de lo que indica la hipótesis nula. El procedimiento de prueba comprende evaluar la 
discrepancia entre las n¡ y las np i0 , con H 0 rechazada cuando la discrepancia es lo suficien¬ 
temente grande. Es natural basar una medida de discrepancia en los cuadrados de las des¬ 
viaciones (n¡ — np l0 ) 2 , ( n 2 — np 20 ) 2 , . . . , (n k — np m ) 2 . Una forma obvia de combinar éstas 
en una medida general es sumarlas para obtener Y.(n¡ — np i0 ) 2 . No obstante, suponga que 
np 10 = 100 y np 20 = 10. Entonces si n¡ = 95 V n 2 = 5, las dos categorías contribuyen con 
las mismas desviaciones al cuadrado a la medida propuesta. Pero n¡ es sólo 5% menor de lo 
que se esperaría cuando H 0 es verdadera, mientras que n 2 es 50% menor. Para tomar en 
cuenta las magnitudes relativas de las desviaciones, cada desviación se divide al cuadrado 
entre la correspondiente cantidad esperada y luego se combinan. 

Antes de dar una descripción más detallada, se debe analizar un tipo de distribución 
de probabilidad llamada distribución ji cuadrada. Esta distribución se introdujo primero en 
la sección 4.4 y se usó en el capítulo 7 para obtener un intervalo de confianza para la va- 
rianza o 2 de una población normal. La distribución ji cuadrada tiene un solo parámetro v, 
llamado número de grados de libertad (gl) de la distribución, con posibles valores 1, 2, 
3, . . . Análogo al valor crítico t av para la distribución í, x 2 > es el valor tal que a del área 
bajo la curva ^ 2 con grado de libertad v está a la derecha de x 2 (vea la figura 14.1). Los va¬ 
lores seleccionados de x 2 a „ se dan en la tabla A.7 del apéndice. 


X 2 curva 
/ 

Área sombreada = a 



Figura 14.1 Un valor crítico para una distribución ji cuadrada. 


TEOREMA 


Siempre que np¡ > 5 para toda i (i = 1,2,... 

, k), la variable 

V 2 V W - np) 2 v 

(observada — esperada) 2 

i=l ri todas las celdas 

esperada 

tiene aproximadamente una distribución ji cuadrada con k — 1 grados de libertad. 
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El hecho que el grado de libertad sea gl = k — 1 es una consecuencia de la restricción 
X N¡ = n. Aun cuando haya k cuentas de celdas observadas, una vez conocida k — 1, la res¬ 
tante se determina de manera única. Esto es, hay sólo k — 1 cuentas de celdas “determina¬ 
das libremente” y por tanto k — 1 grados de libertad. 

Si np i0 se sustituye por np¡ en y 2 , el estadístico de prueba resultante tiene una distri¬ 
bución ji cuadrada cuando H 0 es verdadera. El rechazo de H 0 es apropiado cuando X 2 — c 
(porque grandes discrepancias entre cuentas observadas y esperadas llevan a un valor gran¬ 
de de ^ 2 ), y la opción c = x] ík . , da una prueba con nivel de significación a. 


Hipótesis nula: H 0 : Pl = p l0 , p 2 = p 2Q , ...,p k = p k0 

Hipótesis alternativa: H d : al menos una p¡ no es igual a p ¡0 

,, , „ . , , ^ (observado — esperado) 2 

Valor del estadístico de prueba: x = X -,- 

todas las celdas CSpCIcldO 

= £ ("■ ~ n Pio ) 2 
í“i npto 

Región de rechazo: X 2 — X 2 ak -\ 


Si se concentra en dos características diferentes de un organismo, cada uno controlado por 
un solo gene, y se cruza una variedad pura que tenga genotipo AABB con una variedad pu¬ 
ra que tenga genotipo aabb (las letras mayúsculas denotan alelomorfos dominantes; las mi¬ 
núsculas, alelomorfos recesivos), el genotipo resultante será AaBb. Si estos organismos de 
primera generación se cruzan entonces entre ellos (un cruce dihíbrido), habrá cuatro fenoti¬ 
pos que dependen de si está presente un alelomorfo dominante de uno de los dos tipos. 
Las leyes de Mendel de la herencia implican que estos cuatro fenotipos deben tener proba¬ 
bilidades t^, t/, t/ y ¿ de aparecer en cualquier cruce dihíbrido determinado. 

El artículo “Linkage Studies of the Tomato” ( Trans. Roy al Canadian Institute, 1931: 
1-19) publica los siguientes datos sobre fenotipos de un cruce dihíbrido de tomates altos de 
hoja cortada con tomates enanos de hoja de papa. Hay k = 4 categorías que corresponden a 
los cuatro fenotipos posibles, con la hipótesis nula 

„ 9 3 3 i 

«o -«•*=*• 

Las cantidades esperadas de celdas son 9n/ 16, 3;z/16, 3n/l 6 y ni 16 y la prueba está basada 
en k — 1 = 3 grados de libertad. El tamaño muestral total fue n = 1611. Las cantidades ob¬ 
servadas y esperadas se dan en la tabla 14.2. 

Tabla 14.2 Cantidades observadas y esperadas de celdas para el ejemplo 14.1 


i = 1 i = 2 i = 3 i = 4 

Alto, Alto, Enano, Enano, 

hoja cortada hoja de papa hoja cortada hoja de papa 


926 

288 

293 

104 

906.2 

302.1 

302.1 

100.7 



La contribución a x 2 desde la primera celda es 

(«, - np l0 ) 2 _ (926 - 906.2) 2 

ñpVo 


906.2 


= 0.433 
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Las celdas 2, 3 y 4 contribuyen con 0.658, 0.274 y 0.108, respectivamente, de modo que x 2 
= 0.433 + 0.658 + 0.274 + 0.108 = 1.473. Una prueba con nivel de significación 0.10 re¬ 
quiere ,^ 0103 ’ el número de la fila de grado de libertad 3 y la columna 0.10 de la tabla A.7 
del apéndice. Este valor crítico es 6.251. Como 1.473 no es al menos 6.251, H 0 no puede 
ser rechazada incluso a este nivel más bien grande de significación. La información es bas¬ 
tante consistente con las leyes de Mendel. ■ 

Aun cuando hemos desarrollado la prueba ji cuadrada para situaciones en las que 
k > 2, también se puede usar cuando k = 2. La hipótesis nula en este caso se puede expre¬ 
sar como H 0 : = p w , porque las relaciones p 2 = 1 — p l y p 20 = 1 — p l0 hacen redundan¬ 

te la inclusión de p 2 = p 20 en H 0 . La hipótesis alternativa es // a : p l A p l0 . Estas hipótesis 
también se pueden probar usando una prueba z de dos colas con estadístico de prueba 


Wn) - p l0 A - Pío 


Z = 



Sorprendentemente, los dos procedimientos son por entero equivalentes. Esto es porque se 
puede demostrar que Z 2 = x 2 y fea/ 2) 2 = de modo que x 2 — X],, si }' sólo si |Z| > Z a / 2 * 
Si la hipótesis alternativa es H¿. p¡ > p 10 o H á \ ¡) l < p 10 , la prueba ji cuadrada no se puede 
usar. Se debe entonces revertir a una prueba z de cola superior o inferior. 

Al igual que en el caso con todos los procedimientos de prueba, se debe tener cuida¬ 
do de no confundir significación estadística con significación práctica. Una x 2 calculada que 
exceda de x 2 a k _, puede resultar de un tamaño muestral muy grande más que por cualesquie¬ 
ra diferencias prácticas entre las p i0 hipotética y las verdaderas p¡. Entonces, si p 10 = p 20 = 
P 30 = 1’ P ero l as P¡ verdaderas tienen valores de 0.330, 0.340 y 0.330, es seguro que apare¬ 
cerá un valor grande de x 2 con una n que sea suficientemente grande. Antes de rechazar 
H 0 , las p, deben examinarse para ver si sugieren un modelo diferente del de H 0 desde un 
punto de vista práctico. 


Valores P para pruebas ji cuadrada 


Las pruebas ji cuadrada en este capítulo son todas de cola superior, de modo que ese será el 
enfoque. Así como el valor P para una prueba t de cola superior es el área bajo la curva t v a 
la derecha de la 1 calculada, el valor P para una prueba ji cuadrada de cola superior es el área 
bajo la curva x 2 a I a derecha de la x 2 calculada. La tabla A.7 del apéndice da información 
limitada del valor P porque sólo se tabulan cinco valores críticos de cola superior para ca¬ 
da v diferente. Por tanto, se incluye otra tabla de apéndice, análoga a la tabla A.8, que faci¬ 
lita hacer enunciados más precisos de valor P. 

El hecho de que las curvas t estuvieran todas centradas en cero permitió tabular áreas 
de cola de curva t en forma relativamente compacta, con el margen izquierdo dando valores 
que van de 0.0 a 4.0 en la escala t horizontal y varias columnas que muestran áreas corres¬ 
pondientes de cola superior para varios grados de libertad. El movimiento hacia la derecha 
de curvas de ji cuadrada cuando aumenta el grado de libertad necesita un tipo de tabulación 
un poco diferente. El margen izquierdo de la tabla A. 11 del apéndice da varias áreas de co¬ 
la superior: 0.100, 0.095, 0.090, . . . , 0.005 y 0.001. Cada columna de la tabla es para un 
valor diferente de grado de libertad, y las entradas son valores sobre el eje horizontal ji cua¬ 
drada que capta estas áreas correspondientes de cola. Por ejemplo, al moverse hacia abajo 
al área de cola 0.085, y en sentido horizontal a la columna de grado de libertad 4, se ve que 
el área a la derecha de 8.18 bajo la curva ji cuadrada de grado de libertad 4 es 0.085 (vea la 
figura 14.2). 


* El hecho que (z„ /2 ) 2 = X¡ a es una consecuencia de la relación entre la distribución normal estándar y la distribu¬ 
ción ji cuadrada con grado de libertad 1; si Z ~ ATO. 1), entonces Z 2 tiene una distribución ji cuadrada con 
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Figura 14.2 Un valor Ppara una prueba //cuadrada de cola superior. 

Para captar esta misma área de cola superior bajo la curva de grado de libertad 10, se debe 
ir hasta 16.54. En la columna de grado de libertad 4, la fila superior muestra que si el valor 
calculado de la variable ji cuadrada es menor a 7.77, el área de cola captada (el valor P) ex¬ 
cede de 0.10. Del mismo modo, la fila inferior en esta columna indica que si el valor calcu¬ 
lado excede de 18.46, el área de cola es menor a 0.001 (el valor P < 0.001). 

X 2 cuando las p¡ son funciones de otros parámetros 

Es frecuente que las p¡ sean hipotéticas para depender de un número menor de parámetros 
0 h . . . ,0 m (m < k). Entonces una hipótesis específica que comprenda las 6¡ da las p i0 espe¬ 
cíficas, que entonces se usan en la prueba x 2 - 

En un bien conocido artículo sobre genética (“The Progeny in Generations F 12 to F l7 of a 
Cross Between a Yellow-Wrinkled and a Green-Round Seeded Pea”, J. Genetics, 1923: 255- 
331), G. U. Yule, uno de los primeros expertos en estadística, analizó datos que resultaban 
de cruzar chícharos producidos en un jardín. Los alelomorfos dominantes en el experimen¬ 
to fueron Y = color amarillo y R = forma redonda, que dieron por resultado el YR domi¬ 
nante doble. Yule examinó 269 vainas de cuatro semillas que resultaron de un cruce 
dihíbrido y contó el número de semillas YR de cada vaina. Denotando con X el número de 
las YR de una vaina seleccionada al azar, los posibles valores X son 0, 1,2, 3, 4, que se iden¬ 
tifican con las celdas 1, 2, 3, 4 y 5 de una tabla rectangular (entonces, por ejemplo, una vai¬ 
na con X = 4 da una cantidad observada en la celda 5). 

La hipótesis de que las leyes de Mendel son operativas, y que los genotipos de semi¬ 
llas individuales dentro de una vaina son independientes entre sí, implica que X tiene una 
distribución binomial con n = 4 y 6 = Entonces se desea probar H 0 : p¡ = p l0 , . . . , 
p 5 = p 50 , donde 

p i0 = P(i — 1 YR entre 4 semillas cuando H 0 es verdadera) 

= ( . 4 , ) - 0) 4 -ó-u i = 1, 2, 3, 4, 5; 0 = — 

\i — iJ 16 

Los datos y cálculos de Yule están en la tabla 14.3 con cantidades de celda esperadas np i0 = 
269 p¡o. 

Tabla 14.3 Cantidades de celdas observadas y esperadas para el ejemplo 14.2 


Celda i 

1 

2 

3 

4 

5 

Chícharos YR por vaina 

0 

1 

2 

3 

4 

Observadas 

16 

45 

100 

82 

26 

Esperadas 

9.86 

50.68 

97.75 

83.78 

26.93 

(observadas — esperadas) 2 
esperadas 

3.823 

0.637 

0.052 

0.038 

0.032 
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Entonces \ 2 = 3.823 + ••••+ 0.032 = 4.582. Debido a que ^ 01 k _ l = X 2 0014 = 13.277, 
H 0 no es rechazada al nivel 0.01. La tabla A.l 1 del apéndice muestra que como 4.582 < 
7.77, el valor P para la prueba excede de 0.10. H 0 no debe ser rechazada a ningún nivel ra¬ 
zonable de significación. ■ 

X 2 cuando la distribución básica es continua 

Hasta aquí se ha supuesto que las k categorías están naturalmente definidas en el contexto 
del experimento bajo consideración. La prueba x 2 también se puede usar para probar si una 
muestra proviene de una distribución continua básica específica. Denótese con X la variable 
que se muestrea y supóngase que la función de densidad de probabilidad (fdp) hipotética 
de X es f 0 (x). Al igual que en la construcción de una distribución de frecuencia en el capítu¬ 
lo 1, subdivida la escala de medida de X en k intervalos [a () , a¡), [a Q , a 2 ),..., \a k ¡, a k ), don¬ 
de el intervalo [a f _j, a,) incluye el valor a ¡_, pero no a¡. Las probabilidades de celda de H 0 
son entonces 

Pío = p ( a ¡-i — x < a ¡) = j fo( x ) dx 

«¿-i 

Las celdas deben escogerse de modo que np iQ > 5 para i = 1, . . . , k. Es frecuente que se 
seleccionen de modo que las np i0 sean iguales. 

Para ver si el tiempo de inicio de trabajo de parto en madres está uniformemente distribui¬ 
do en todo un día, se puede dividir un día en k periodos, cada uno con duración 24/A:. La 
hipótesis nula expresa que/(x) es la función de densidad de probabilidad (fdp) uniforme en 
el intervalo [0, 24], de modo que p j0 = l/k. El artículo “The Hour of Birth” (British J. Pre- 
ventive and Social Medicine, 1953: 43-59) habla de 1186 tiempos de inicio, que se clasifi¬ 
caron en k = 24 intervalos de 1 hora que principiaban a la medianoche, y resultaron en 
cuentas de celda de 52, 73, 89, 88, 68, 47, 58, 47, 48, 53, 47, 34, 21, 31, 40, 24, 37, 31, 47, 
34, 36, 44, 78 y 59. Cada una de las cantidades esperadas de celda es 1186 • ¿ = 49.42 y 
el valor resultante de x 2 es 162.77. Como X 2 00l 23 = 41.637, el valor calculado es muy sig¬ 
nificativo, y la hipótesis nula tiene un rotundo rechazo. Hablando en términos generales, pa¬ 
rece que es mucho más probable que el trabajo de parto se inicie ya bien entrada la noche 
que durante las horas hábiles normales. ■ 

Para probar si una muestra proviene de una distribución normal específica, los pará¬ 
metros fundamentales son = py d 2 = cry cada p ¡Q será una función de estos parámetros. 

En cierta universidad, se supone que los exámenes finales duran 2 horas. El departamento 
de psicología construyó un examen final departamental para un curso elemental que se pen¬ 
saba podría satisfacer los siguientes criterios: 1) el tiempo real tomado para completar el 
examen está distribuido de manera normal, 2) p = 100 min, y 3) exactamente 90% de to¬ 
dos los estudiantes terminarán dentro del periodo de 2 horas. Para ver si éste es el caso en 
realidad, se seleccionaron al azar 120 estudiantes y se registraron sus tiempos para terminar 
el examen. Se decidió que debían emplearse k = 8 intervalos. Los criterios implican que el 
90° percentil de la distribución del tiempo de terminación es p + 1.28cr = 120. Como 
p = 100, esto implica que cr = 15.63. 

Los ocho intervalos que dividen la escala normal estándar en ocho segmentos igual¬ 
mente probables son [0, 0.32), [0.32, 0.675), [0.675, 1.15), [1.15, °°), y sus cuatro similares 
en el otro lado de 0. Para p = 100 y cr = 15.63, estos intervalos se convierten en [100, 105), 
[105, 110.55), [110.55, 117.97) y [117.97, °°). Así, p i0 = \ = 0.125 (i = 1, . . . , 8), de mo¬ 
do que cada cantidad de celdas esperada es np ¡0 = 120(0.125) = 15. Las cantidades de 
celda observadas fueron 21, 17, 12, 16, 10, 15, 19 y 10, que da por resultado en una x 2 
de 7.73. Como X 2 0l01 = 12.017 y 7.33 no es > 12.017, no hay evidencia para concluir que 
los criterios no se han satisfecho. ■ 


Ejemplo 14.3 




Ejemplo 14.4 
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EJERCICIOS Sección 14.1 (1-11) 


1. ¿Cuál conclusión sería apropiada para una prueba ji cua¬ 
drada de cola superior en cada una de las situaciones si¬ 
guientes? 

a . a = 0.05, gl = 4,x 2 = 12.25 

b. a = 0.01, gl = 3,x 2 = 8.54 

c. a = 0.10, gl = 2, x 2 — 4.36 

d. a = 0.01, k = 6, x 2 ~ 10.20 

2. Diga cuanto pueda acerca del valor P para una prueba ji 
cuadrada de cola superior en cada una de las situaciones si¬ 
guientes. 

a. x 2 = 7.5, gl = 2 b. x 2 = 13.0, gl = 6 

c. x 2 = 18.0, gl = 9 d. x 2 = 21.3, & = 5 

e. x 2 ~ 5-0, k = 4 

3. El departamento de estadística de una importante universi¬ 
dad mantiene un servicio de asesoría privada a estudiantes 
en sus cursos de introducción. El servicio cuenta con profe¬ 
sores que esperan que 40% de sus clientes sean del curso de 
estadística para negocios, 30% de estadística para ingenie¬ 
ría, 20% del curso de estadística para estudiantes de cien¬ 
cias sociales, y el otro 10% del curso de estudiantes de 
agricultura. Una muestra aleatoria de n = 120 estudiantes 
dejó ver que había 52, 38, 21 y 9 de los cuatro cursos. ¿Es¬ 
tos datos sugieren que los porcentajes en los que el profeso¬ 
rado se basaba no son correctos? Exprese y pruebe las 
hipótesis relevantes usando a = 0.05. 

4. Se ha supuesto que cuando los pichones que regresan a su 
palomar se desorientan de algún modo, no mostrarán prefe¬ 
rencia para ninguna dirección después de alzar el vuelo (de 
modo que la dirección X debería estar uniformemente dis¬ 
tribuida en el intervalo de 0 o a 360°). Para probar esto, se 
desorienta a 120 pichones, se sueltan y se registra la direc¬ 
ción de vuelo de cada uno de ellos; a continuación aparecen 
los datos resultantes. Utilice una prueba ji cuadrada al nivel 
0.10 para ver si la información apoya a la hipótesis. 


Dirección 

0-<45° 

45-<90° 

90-<135° 

Frecuencia 

12 

16 

17 

Dirección 

135-080° 

180-<225° 

225-070° 

Frecuencia 

15 

13 

20 

Dirección 

270-015° 

315-060° 


Frecuencia 

17 

10 



5. Un sistema de recuperación de información tiene 10 luga¬ 
res de almacenamiento. Se ha guardado información con la 
esperanza de que la proporción de peticiones, a largo plazo 
para la posición i, sea dada por p¡ = (5.5 — | i — 5.5 | )/30. 
Una muestra de 200 peticiones de recuperación dio las si¬ 
guientes frecuencias para las posiciones 1-10, respectiva¬ 
mente: 4, 15, 23, 25, 38, 31, 32, 14, 10 y 8. Utilice una 
prueba ji cuadrada al nivel de significación de 0.10 para de¬ 
terminar si la información es consistente con las proporcio¬ 
nes a priori (use el método del valor P). 

6. El sorgo es una importante cosecha de cereales cuya calidad 
y aspecto podrían ser afectadas por la presencia de pigmen¬ 
tos en el pericarpio (las paredes del ovario de la planta). El ar¬ 


tículo “A Genetic and Biochemical Study on Pericarp Pig- 
ments in a Cross Between Two Cultivare of Grain Sorghum, 
Sorghum Bicolor” ( Heredity , 1976: 413-416) informa de un 
experimento que comprendía una cruza inicial, entre sorgo 
CK60 (una variedad norteamericana con semillas blancas), y 
Abu Taima (una variedad etiope con semillas amarillas), pa¬ 
ra producir plantas con semillas rojas y luego una autocruza 
de las plantas de semilla roja. Según la teoría genética, esta 
cruza F-, debería producir plantas con semillas rojas, amari¬ 
llas o blancas en una proporción de 9: 3: 4. A continuación 
aparece la información del experimento. ¿Los datos confir¬ 
man o contradicen la teoría genética? Pruebe al nivel 0.05 
usando el método del valor P. 


Color de semilla 

Rojo 

Amarillo 

Blanco 

Frecuencia observada 

195 

73 

100 


7. Durante mucho tiempo, los criminólogos han debatido sobre 
si hay una relación entre las condiciones climáticas y la in¬ 
cidencia de delitos violentos. El autor del artículo “Is There 
a Season for Homicide?” ( Criminology , 1988: 287-296) cla¬ 
sificó 1361 homicidios según la estación del año y resulta¬ 
ron los datos siguientes. Pruebe la hipótesis nula de iguales 
proporciones usando a = 0.01 mediante el uso de la tabla ji 
cuadrada para decir cuanto sea posible acerca del valor P. 

Invierno Primavera Verano Otoño 

328 334 372 327 

8. El artículo “Psychiatric and Alcoholic Admissions Do Not 
Occur Disproportionately Cióse to Patients’ Birthday” (Psy- 
chological Reports, 1991: 944-946) se concentra en la exis¬ 
tencia de alguna relación entre la fecha de ingreso de un 
paciente para tratamiento de alcoholismo y el cumpleaños 
del paciente. Suponiendo un año de 365 días (es decir, ex¬ 
cluyendo un año bisiesto), en ausencia de cualquier rela¬ 
ción, es probable que la fecha de admisión de un paciente 
sea cualquiera de los 365 días. Los investigadores estable¬ 
cieron cuatro diferentes categorías: 1) no más de 7 días de 
la fecha de cumpleaños, 2) entre 8 y 30 días, inclusive, des¬ 
de el cumpleaños, 3) entre 31 y 90 días, inclusive, del cum¬ 
pleaños, y 4) más de 90 días del cumpleaños. Una muestra 
de 200 pacientes dio frecuencias observadas de 11, 24, 69 y 
96 para las categorías 1, 2, 3 y 4, respectivamente. Exprese 
y pruebe las hipótesis relevantes usando un nivel de signifi¬ 
cación de 0.01. 

9. Se ha teorizado el tiempo de respuesta de un sistema compu- 
tarizado, a una petición de cierto tipo de información, 
como una distribución exponencial con parámetro A — 1 se¬ 
gundo (de modo que si X = tiempo de respuesta, la función 
de densidad de probabilidad (fdp) de X bajo H 0 es f 0 (x) = 
e~ x para x £ 0). 

a. Si se hubiera observado X v X 2 , .... y se deseara usar 
la prueba ji cuadrada con cinco intervalos de clase de 
igual probabilidad bajo H 0 , ¿cuáles serían los intervalos 
de clase resultantes? 

b. Realice la prueba ji cuadrada usando los datos siguien¬ 
tes de una muestra aleatoria de 40 tiempos de respuesta: 
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0.10 

0.99 

1.14 

1.26 

3.24 

0.12 

0.26 

0.80 

0.79 

1.16 

1.76 

0.41 

0.59 

0.27 

2.22 

0.66 

0.71 

2.21 

0.68 

0.43 

0.11 

0.46 

0.69 

0.38 

0.91 

0.55 

0.81 

2.51 

2.77 

0.16 

1.11 

0.02 

2.13 

0.19 

1.21 

1.13 

2.93 

2.14 

0.34 

0.44 


10. a. Demuestre que otra expresión para el estadístico ji cua¬ 
drada es 


¿Por qué es más eficiente calcular usando esta fórmula? 
b. Cuando la hipótesis nula es H 0 : p l = p 2 — • • ■ = p k = 
\lk (es decir, p ¡0 = l/k para toda i), ¿cómo se simplifica 
la fórmula del inciso a? Utilice la expresión simplifica¬ 
da para calcular \ 2 para los datos de pichón/dirección 
del ejercicio 4. 

11. a. Habiendo obtenido una muestra aleatoria de una pobla¬ 
ción, el lector desea usar una prueba ji cuadrada para 
determinar si la distribución de población es normal están¬ 
dar. Si basa la prueba en seis intervalos de clase que ten¬ 


gan igual probabilidad bajo H 0 , ¿cuáles deberían ser los 
intervalos de clase? 

b. Si desea usar una prueba ji cuadrada para probar H 0 : la 
distribución poblacional es normal con p, = 0.5, <r = 
0.002 y la prueba ha de basarse en seis intervalos de cla¬ 
se igualmente probables (bajo H 0 ), ¿cuáles deben ser es¬ 
tos intervalos? 

c. Use la prueba ji cuadrada con los intervalos del inciso b 
para determinar, con base en los siguientes 45 diámetros 
de tomillos, si el diámetro de éstos es una variable nor¬ 
malmente distribuida con p = 0.5 pulgadas, cr = 0.002 
pulgadas. 


0.4974 

0.4976 

0.4991 

0.5014 

0.5008 

0.4993 

0.4994 

0.5010 

0.4997 

0.4993 

0.5013 

0.5000 

0.5017 

0.4984 

0.4967 

0.5028 

0.4975 

0.5013 

0.4972 

0.5047 

0.5069 

0.4977 

0.4961 

0.4987 

0.4990 

0.4974 

0.5008 

0.5000 

0.4967 

0.4977 

0.4992 

0.5007 

0.4975 

0.4998 

0.5000 

0.5008 

0.5021 

0.4959 

0.5015 

0.5012 

0.5056 

0.4991 

0.5006 

0.4987 

0.4968 






14.2 Pruebas de bondad de ajuste 
para hipótesis compuestas 


En la sección previa, se presentó una prueba de bondad de ajuste basada en un estadístico 
X 2 para decidir entre H 0 : p t = p lQ , . . . , p k = p kn y la alternativa H a que expresa que //„ no 
es verdadera. La hipótesis nula fue una hipótesis simple en el sentido que cada p ¡0 era un 
número especificado, de modo que las cantidades esperadas de celda cuando H 0 era verda¬ 
dera eran números determinados de manera única. 

En diversas situaciones, hay k categorías que ocurren naturalmente, pero H 0 expresa 
sólo que las p¡ son funciones de otros parámetros 0 V . .., 0 m sin especificar los valores de 
estos parámetros 0. Por ejemplo, una población puede estar en equilibrio con respecto a las 
proporciones de los tres genotipos AA, Aa y aa. Con p 1 ,p 2 y p 3 denotando estas proporcio¬ 
nes (probabilidades), se puede desear probar 

H 0 : Pl = d\p 2 = 20(1 - 0),p 3 = (1 - 0) 2 (14.1) 

donde 0 representa la proporción del gene A en la población. Esta hipótesis es compuesta 
porque saber que H 0 es verdadera no determina de manera única las probabilidades de cel¬ 
da, y cantidades esperadas de celda, sino sólo su forma general. Para llevar a cabo una prue¬ 
ba x 2 , los parámetros 0¡ desconocidos deben estimarse en primer término. 

Del mismo modo, puede haber interés en probar si una muestra provino de una fami¬ 
lia particular de distribuciones sin especificar ningún miembro particular de la familia. Pa¬ 
ra usar la prueba x 2 con e l fin de ver si la distribución es Poisson, por ejemplo, debe 
estimarse el parámetro A. Además, debido a que hay en realidad un número infinito de po¬ 
sibles valores de una variable Poisson, estos valores deben agruparse de manera que haya 
un número finito de celdas. Si H 0 expresa que la distribución básica es normal, el uso de una 
prueba x 2 debe estar precedido por una selección de celdas y estimación de p y cr. 

X 2 cuando se estimen parámetros 

Al igual que antes, k denotará el número de categorías o celdas y p¡ denotará la probabili¬ 
dad de una observación que caiga en la í-ésima celda. La hipótesis nula indica ahora que 
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cada p¡ es una función de un pequeño número de parámetros 0,, . . . , 6 m con los 6¡ especi¬ 
ficados de otro modo: 

H 0 - Pi = TTi(O), ...,p k = n k {0) donde 0 = (0„ . . . , 0J 
H d : la hipótesis H 0 no es verdadera 

Por ejemplo, para H 0 de (14.1), m = 1 (hay sólo un 9), 77,(0) = 0 2 , 7 t 2 (0) = 20(1 — 0) y 
77 3 (0) = (1 - 0) 2 . 

En el caso de k = 2, realmente hay sólo una variable aleatoria, N { (porque N { + N 2 = ri), 
que tiene una distribución binomial. La probabilidad conjunta de que N 1 = n , y /V, = n 2 es 
entonces 


P(2V, = n v N 2 = n 2 ) = ( n ni )p¡ i • p" 2 2 °c ¡fi • p '\2 

donde p { + p 2 = 1 y n, + n-, = n. Para k general, la distribución conjunta de N v . . ., N k es 
la distribución multinomial (sección 5.1) con 


P(N l n v ...,N k n k ) °c p’¡< ■ p% • ■ 


(14.3) 

Cuando H 0 es verdadera (14.3) se convierte en 

P(N l n v . . . ,N k n k ) °c [ 17 ,( 0 )]". 

■ • [7T k (0)P 

(14.4) 


Para aplicar una prueba ji cuadrada, debe estimarse 0 = (0,, . . . , 0 m ). 



MÉTODO DE 
ESTIMACIÓN 


Ejemplo 14.5 En seres humanos hay el grupo sanguíneo MN, compuesto por personas que tienen uno de 
los tres tipos de sangre M, MN y N. El tipo está determinado por dos alelos y no hay pre¬ 
dominio, de modo que los tres posibles genotipos dan lugar a tres fenotipos. Una población 
formada por personas del grupo MN está en equilibrio si 

P( M) = Pl = 9 2 
P(MN) =p 2 = 20(1 - 0) 

P(N) = p 2 = (1 - 0) 2 

para algún 0. Suponga que una muestra de esa población dio los resultados mostrados en la 
tabla 14.4 


Denótese con n 2 , . . . , n k los valores observados de N v . . . , N k . Entonces 0,,.. . 
, 0 m son los valores de los 0 ( que maximizan (14.4). 


Los estimadores resultantes 0,, . . . , 0 m son los estimadores de máxima verosimilitud 
de 0,, ... , 0 ; este principio de estimación se discutió en la sección 6.2. 


Tabla 14.4 Cantidades observadas para el ejemplo 14.5 

Tipo M MN N 


Observado 


125 


225 


150 


n = 500 



[77 1 (0)]» 1 [77 2 (0)]^[77 3 (0)]"> = [( 0 2 )]"'[ 20(1 - 0)]”“[(1 - 0 ) 2 ]"’ 
= 2 " ¡ • 0 2 "' +, ‘- • (1 - 0 )"* +2 "> 


Entonces 
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Al maximizar esto con respecto a 0 (o bien, lo que es lo mismo, al maximizar el logaritmo 
natural de esta cantidad, que es más fácil de derivar), se obtiene 

~ _ _2 n, + n 2 _ _ 2 n l + n 2 

[(2 mj + n 2 ) + ( n 2 + 2 n 3 )] 2 n 

Con n t = 125 y n 2 = 225, 0 = 475/1000 = 0.475. ■ 

Una vez que 0 = (0 1? .... 9 m ) haya sido estimado por 0 = (9¡, . . . , 0 m ), las cantida¬ 
des esperadas estimadas son los mr¡(0) . Éstos se usan ahora en lugar de los np i0 de la sec¬ 
ción 14.1 para especificar un estadístico x 2 - 


TEOREMA 


Bajo condiciones de “regularidad” en 0 t , . . . , 6 m y las 7r ; (0), si 0¡, . . . , 6 m se esti¬ 
man por el método de máxima verosimilitud como se describió antes y n es grande, 

¿ [/V,- ~ ntr0)] 2 
nirí») 

tiene aproximadamente una distribución ji cuadrada con k — 1 — m grados de liber¬ 
tad cuando H 0 de (14.2) es verdadera. Una prueba aproximadamente de nivel a de H 0 
contra // a , rechaza //„ si x 2 — X 2 k , • En la práctica, la prueba se puede usar si 

mrffi) > 5 para toda i. 


X 2 = X 

todas las celdas 


(observada — esperada estimada) 2 
esperada estimada 


Note que el número de grados de libertad es reducido por el número de los estimados. 


Ejemplo 14.6 

(continúa 
ejemplo 14.5) 


Con 9 = 0.475 y n = 500, las cantidades de celda estimadas esperadas son mr^O) = 
5OO(0) 2 = 112.81, mr 2 (§) = (500)(2)(0.475)(1 - 0.475) = 249.38 y mr 3 (0) = 500 - 
112.81 - 249.38 = 137.81. Entonces 


_ (125 - 112.81) 2 + (225 - 249.38) 2 + (150 - 137.81) 2 = 4 ?8 


C ° m0 *0.05,*—i- 


112.81 

= Y 2 = - 2 

a 0.05,3-1-1 


249.38 


137.81 


A.l 1 del apéndice muestra que el valor P ~ 0.029. 


*0051 = 3-843 y 4.78 > 3.843, H 0 es rechazada. La 


tabla 


Ejemplo 14.7 Considere una serie de juegos entre dos equipos, I y II, que termina tan pronto como un equi¬ 
po haya ganado cuatro juegos (sin posibilidad de empate). Un modelo simple de probabili¬ 
dad para esa serie supone que los resultados de juegos sucesivos son independientes, y que 
la probabilidad de que el equipo I gane cualquier juego en particular es una constante 9. De 
manera arbitraria se designa al equipo I como el mejor, de modo que 9 > 0.5. Cualquier se¬ 
rie particular puede terminar entonces después de 4, 5, 6 o 7 juegos, respectivamente. En¬ 
tonces 

tt { (9) = P( I gana en 4 juegos) 4- ,P(II gana en 4 juegos) 

= 9 a + (1 - 9) A 

77^(9) = Pi\ gana 3 de los primeros 4 y el quinto) 

+ Pi\ pierde 3 de los primeros 4 y el quinto) 

= ^je 3 (i -0)-0 + (i)fl(i -0) 3 -d -o) 

= 40(1 - 9)[9 3 + (1 ~ 0) 3 ] 

7 t 3 (0) = 1O0 2 (1 - 0) 2 [0 2 + (1 - 9) 2 ] 
tt 4 (0) = 200 3 (1 - 0) 3 
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El artículo “Seven-Game Series in Sports” de Groeneveld and Meeden (Mathematics 
Magazine, 1975: 187-192) probó el ajuste de este modelo a los resultados de juegos, para 
determinar el campeonato de la National Hockey League, durante el periodo 1943-1967 
(cuando la membresía de la liga era estable). Los datos aparecen en la tabla 14.5. 


Tabla 14.5 Cantidades observadas y esperadas para el modelo simple 


Celda 

1 

2 

3 

4 


Número de juegos jugados 

4 

5 

6 

7 


Frecuencia observada 

15 

26 

24 

18 

n = 83 

Frecuencia esperada estimada 

16.351 

24.153 

23.240 

19.256 



Las cantidades de celda esperadas estimadas son 8377,(0), donde 0 es el valor de 0 que ma- 
ximiza 



{0 4 + (1 - 0) 4 } 15 • {40(1 - 0)[0 3 + (1 - 0) 3 ]} 26 

• {1O0 2 (1 - 0) 2 [0 2 + (1 - 0) 2 ]} 24 • {200 3 ( 1 - 0) 3 } 18 (14.5) 

Los métodos estándar de cálculo no dan una fórmula sencilla para el valor que lleva al 
máximo a 0, de modo que debe calcularse usando métodos numéricos. El resultado es 
0 = 0.654, del que se calculan 77,(0) y las cantidades de celda esperadas estimadas. El va¬ 
lor calculado de x 2 es 0.360, y (como k — 1 — m = 4 — 1 — 1 = 2) x 2 , 02 = 4.605. Por tan¬ 
to, no hay razón para rechazar el modelo simple como se aplica a la serie de juegos para 
decidir el campeonato de la NHL. 

El artículo citado también consideró información de la Serie Mundial (de béisbol) pa¬ 
ra el periodo 1903-1973. Para el modelo simple, x 2 = 5.97, de modo que el modelo no pare¬ 
ce apropiado. La razón sugerida para esto es que para el modelo simple 

Pila serie dura 6 juegos | la serie dura al menos 6 juegos) > 0.5 (14.6) 

mientras que, de las 38 series que en realidad duraron al menos seis juegos, sólo 13 duraron 
exactamente seis. Se introduce entonces el siguiente modelo alternativo: 

77 ,( 0 !, 0 2 ) = 0 4 + (1 - 0,) 4 

77 2 (0„ 0 2 ) = 40,(1 - 0,)[0 ¡ + (1 - 0,) 3 ] 

77 3 (0 „ 0 2 ) = 1002(1 ~ 0i) 2 0 2 
77 4 (0„ 0 2 ) = 1002(1 - W - 0 2 ) 

Las primeras dos ir¡ son idénticas al modelo simple, mientras que 0, es la probabilidad con¬ 
dicional de (14.6) (que ahora puede ser cualquier número entre 0 y 1). Los valores de 0, y 
0 2 que maximizan la expresión análoga a la expresión (14.5) se determinan numéricamente 
como 0, = 0.614, 0-, = 0.342. En la tabla 14.6 aparece un resumen, y x 1 = 0.384. Puesto 
que se estiman dos parámetros, el grado de libertad es igual a k — 1 — m = 1 con = 
2.706, lo cual indica un buen ajuste de la información al nuevo modelo. 

Tabla 14.6 Cantidades observadas y esperadas para el modelo más complejo 


Número de juegos jugados 

4 

5 

6 

7 

Frecuencia observada 

12 

16 

13 

25 

Frecuencia esperada estimada 

10.85 

18.08 

12.68 

24.39 
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Una de las condiciones de regularidad en las 9¡ del teorema es que son funcionalmen¬ 
te independientes una de otra. Esto es, ningún 0, se puede determinar a partir de los valores 
de otros 9¡, de modo que m es el número de parámetros estimados funcionalmente indepen¬ 
dientes. Una regla empírica general para los grados de libertad en una prueba ji cuadrada es 
la siguiente. 


/ número de cantidades de \ / número de parámetros 

1 celda determinadas libremente J \ independientes estimados 


Esta regla se usará en relación con diversas pruebas de ji cuadrada diferentes en la siguien¬ 
te sección. 

Bondad de ajuste para distribuciones discretas 

Numerosos experimentos comprenden la observación de una muestra aleatoria Aj, X 2 , . . . , 
X n de alguna distribución discreta. Entonces se puede desear investigar si la distribución bá¬ 
sica es miembro de una familia particular, por ejemplo la familia Poisson o binomial nega¬ 
tiva. En el caso de una distribución Poisson y una binomial negativa, el conjunto de posibles 
valores es infinito, de modo que los valores deben agruparse en k subconjuntos antes que 
pueda usarse una prueba ji cuadrada. Las agrupaciones deben hacerse de modo que la fre¬ 
cuencia esperada en cada celda (grupo) sea al menos 5. La última celda corresponderá en¬ 
tonces a X valores de c, c + 1, c + 2, . . . para algún valor de c. 

Esta agrupación puede complicar de manera considerable el cálculo de los 9¡ y canti¬ 
dades de celda esperadas estimadas. Esto se debe a que el teorema exige que las 9¡ se ob¬ 
tengan de las cantidades de celda ÍVj, . . . , N k más que los valores muéstrales X v ... , X n . 

Ejemplo 14.8 La tabla 14.7 presenta información de cantidades sobre el número de plantas Larrea divari- 
cata halladas en cada uno de los 48 cuadrantes de muestreo, como se publica en el artículo 
“Some Sampling Characteristics of Plants and Arthropods of the Arizona Desert” ( Ecology , 
1962: 567-571)." 


Tabla 14.7 Cantidades observadas para el ejemplo 14.8 


Celdas 

1 

2 

3 

4 

5 

Número de plantas 

0 

1 

2 

3 

>4 

Frecuencia 

9 

9 

10 

14 

6 


El autor ajustó una distribución Poisson a los datos. Denote con A el parámetro Pois¬ 
son para el momento en que las seis cantidades de la celda 5 eran en realidad 4, 4, 5, 5, 6, 6. 
Entonces, denotando los valores muéstrales por x u , x 4g , nueve de las x¡ fueron 0, nueve 
fueron 1, y así sucesivamente. La probabilidad de la muestra observada es 

e~ A A l] e K Á. x “ e^^A^ 1 e~ 48A A 101 

*l ! -V *1 ! .-V *1 ! .*48 ! 

El valor de A para el que esto se maximiza es A = Y.x/n = 101/48 = 2.10 (el valor publi¬ 
cado en el artículo). 
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Ejemplo 14.9 

(continúa 
ejemplo 14.8) 
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581 


No obstante, la A requerida para x 2 se obtiene de maximizar la expresión (14.4) más 
que la probabilidad de la muestra completa. Las probabilidades de celda son 


e~ A A'~' 

77 ( A) = —-- 

C i - 1)! 


i = 1, 2, 3, ■ 


77 5 (A) =1-1 


~ A A'' 


i=0 '■ 


de modo que el lado derecho de (14.4) se convierte en 


0 

4* 

1 

9 

(V A A'l 

9 

e A A 2 

10 

|V A A 3 1 

14 

0 ! 


1 ! 


2! 


3! 



<r A A- 
¿=o i! . 


No hay una fórmula fácil para A, el valor de A para maximizar, en esta última expresión, por 
lo que debe obtenerse numéricamente. ■ 


Debido a que las estimaciones del parámetro suelen ser mucho más difíciles de calcu¬ 
lar del grupo de datos que de la muestra completa, prácticamente siempre se calculan usan¬ 
do este último método. Cuando se usan estos estimadores “completos” en el estadístico ji 
cuadrada, la distribución del estadístico se altera y una prueba a de nivel ya no es especifi¬ 
cada por el valor crítico y 2 , , 

L ' x a,k—\—m 


Sean 0 1; ..., 0 m los estimadores de máxima verosimilitud de 0¡, . . . , 6 m con base en 
la muestra completa X t , . . . , X n , y denótese con \ 2 e l estadístico basado en estos es¬ 
timadores. Entonces el valor crítico c a que especifica una prueba de nivel a de cola 
superior satisface a 


X 


2 

a,k~ 1 — m 


- C « - A, 


a,k— 1 


(14.7) 



El procedimiento de prueba implicado por este teorema es el siguiente: 


Si y 2 > y 2 , ,, rechace H n . 

/v ' x -a,k— 1 u 

Si y 2 < y 2 , , , no rechace H n . (14.8) 

/v ' v a,k— 1— m u 

Si y 2 , , < y 2 < X 2 , ,, sin decisión. 

' x a,k— 1— m /K a,k— 1 


Con el uso de A = 2.10, las cantidades de celda esperadas estimadas se calculan de 
donde n =48. Por ejemplo, 

~ e ~ 2l (2 11 ° 

ht 7,(A) = 48 • ^ ■ = (48)(e -21 ) = 5.88 

Del mismo modo, mr 2 (A) = 12.34, mr 3 (X) = 12.96, mr 4 (Á) = 9.07 y mr 5 (X) = 48 — 
5.88 — • ■ • — 9.07 = 7.75. Entonces 


X 


2 


(9 ~ 5.88 ) 2 (6 - 7.75 ) 2 

5.88 7.75 


Como m = 1 y k = 5, al nivel 0.05 se necesita ^0053 = 7-815 y ^0054 = 9.488. Como 6.31 
< 7.815, no se rechaza // 0 ; al nivel de 5%, la distribución Poisson da un ajuste razonable a 
los datos. Nótese que _y 2 1()3 = 6.251 y xl l04 = 7.779, de modo que al nivel 0.10 se tendría 
que retener un juicio sobre si la distribución Poisson era apropiada. ■ 
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A veces hasta las estimaciones de máxima verosimilitud basadas en la muestra com¬ 
pleta son muy difíciles de calcular. Este es el caso, por ejemplo, para la distribución bino- 
mial negativa (generalizada) de dos parámetros. En tales situaciones, se usan con frecuencia 
estimaciones de método de momentos y las \ 2 resultantes se comparan con , aun¬ 

que no se sabe hasta qué punto el uso de estimadores de momento afecta al verdadero valor 
crítico. 


Bondad de ajuste para distribuciones continuas 

La prueba ji cuadrada también se puede usar para probar si la muestra proviene de una fa¬ 
milia especificada de distribuciones continuas, como es el caso de la familia exponencial o 
la familia normal. La preferencia de celdas (intervalos de clase) es todavía más arbitraria en 
el caso continuo que en el discreto. Para asegurar que la prueba ji cuadrada es válida, las 
celdas deben escogerse independientemente de las observaciones muéstrales. Una vez esco¬ 
gidas las celdas, casi siempre es muy difícil estimar parámetros no especificados (por ejem¬ 
plo p y cr en el caso normal) a partir de las cantidades de celda observadas, de modo que en 
su lugar se calculan estimadores de máxima verosimilitud basadas en la muestra completa. 
El valor crítico c a de nuevo satisface a (14.7), y el procedimiento de prueba está dado por 
(14.8). 

Ejemplo 14.10 El Institute of Nutrition of Central America and Panama (INCAP) ha llevado a cabo exten¬ 
sos estudios de dietas y proyectos de investigación en Centroamérica. En un estudio que 
apareció en la edición de noviembre de 1964 de la American Journal ofClinical Nutrition 
(“The Blood Viscosity of Various Socioeconomic Groups in Guatemala”), se publicaron las 
mediciones de colesterol seroso total de una muestra de 49 indígenas rurales de bajos ingre¬ 
sos, como sigue (en mg/1): 

204 108 140 152 158 129 175 146 157 174 192 194 144 152 135 223 145 

231 115 131 129 142 114 173 226 155 166 220 180 172 143 148 171 143 

124 158 144 108 189 136 136 197 131 95 139 181 165 142 162 


¿Es posible que el nivel de colesterol seroso esté normalmente distribuido para esta pobla¬ 
ción? Suponga que, antes de la muestra, se pensaba que los posibles valores para p y cr eran 
150 y 30, respectivamente. Los siete intervalos de clase igualmente probables para la distri¬ 
bución estándar normal son (—oo, —1.07), (—1.07, —0.57), (—0.57, —0.18), (—0.18, 0.18), 
(0.18, 0.57), (0.57, 1.07) y (1.07, °°), con cada punto extremo proporcionado también la 
distancia en desviaciones estándares desde la media para cualquier otra distribución normal. 
Para p = 150 y cr = 30, estos intervalos se convierten en (—°°, 117.9), (117.9, 132.9), 
(132.9, 144.6), (144.6, 155.4), (155.4, 167.1), (167.1, 182.1) y (182.1, °o). 

Para obtener las probabilidades estimadas de celdas Tr x {jx, cr), . . . , 7r 7 (p, cr), primero 
se necesitan los estimadores de máxima verosimilitud p y cf. En el capítulo 6, la estimación 
de máxima verosimilitud resultó ser [2Xx, — x) 2 /n\ " (más que s), de modo que .v = 31.75, 


p = x = 157.02 



2 (X; — X) 2 

1/2 

in — 1)í 2 

(J — 

n 


n 



Cada 7r ; (p, cr) es entonces la probabilidad de que una variable aleatoria A con media 157.02 
y desviación estándar 31.42 caiga en el intervalo de í-ésima clase. Por ejemplo, 

7r 2 (p, &) = P{ 117.9 132.9) = P(-1.25 <Z<-0.77) = 0.1150 

así «7r,(p, oj = 49(0.1150) = 5.64. Las cantidades de celdas observadas y esperadas se 
muestran en la tabla 14.8. 
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La x 2 calculada es 4.60. Con k = 7 celdas y m = 2 parámetros estimados, v? 05 k , = 

^o.05,6 = 12592 y X(W—i- m = ^o.o5,4 = 9 ' 488 ' Como 4 ' 60 - 9 - 488 ’ una d i stribuc i ón nor¬ 
mal da un muy buen ajuste a los datos. 


Tabla 14.8 Cantidades observadas y esperadas para el ejemplo 14.10 


Celda 

(-oo, 117.9) 

(117.9,132.9) 

(132.9,144.6) 

(144.6,155.4) 

Observada 

5 

5 

11 

6 

Estimada esperada 

5.17 

5.64 

6.08 

6.64 

Celda 

(155.4, 167.1) 

(167.1,182.1) 

(182.1, oo) 


Observada 

6 

7 

9 


Estimada esperada 

7.12 

7.97 

10.38 



Ejemplo 14.11 El artículo “Some Studies on Tuft Weight Distribution in the Opening Room” (Textile Re¬ 
search J., 1976: 567-573) publica los datos siguientes sobre la distribución del peso X en el 
peso de mechones de salida (mg) de fibras de algodón para el peso de entrada x 0 = 70. 




Intervalo 

0-8 

8-16 

16-24 

24-32 

32-40 

40-48 

48-56 

56-64 

64-70 







1 




1 

0 


Ir 

Frecuencia observada 

20 

8 

7 

2 

1 

0 



Frecuencia esperada 

18.0 

9.9 

5.5 

3.0 

1.8 

0.9 

0.5 

0.3 

0.1 


Los autores postularon una distribución exponencial truncada: 

H 0 - f(x) = —X7 0 < x < x 0 
1 — e 

La media de esta distribución es 



El parámetro A se estimó al sustituir /j, con x = 13.086 y resolver la ecuación resultante pa¬ 
ra obtener A = 0.0742 (de modo que A es una estimación de método de momentos y no de 
máxima verosimilitud). Entonces con A sustituyendo a A en/(x), las frecuencias de celdas 
esperadas estimadas como se exhibieron antes se calculan como 

- ( a¡ 40(e^“" — e~ A "“') 

40tt,.(A) = 40R(a ¡ _ 1 < X < a,) = 40 I f(x) dx = ■ _ 1 

J a ¡-i 1 e 

donde a¡) es el í-ésimo intervalo de clase. Para obtener cantidades de celdas esperadas 
de al menos 5, las últimas seis celdas se combinan para dar cantidades observadas de 20, 8, 
7, 5 y cantidades esperadas de 18.0, 9.9, 5.5, 6.6. El valor calculado de ji cuadrada es en¬ 
tonces x 2 = 1.34. Como xl 052 = 5.992, H 0 no es rechazada, y el modelo exponencial trun¬ 
cado da un buen ajuste. ■ 
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Una prueba especial para normalidad 

Las gráficas de probabilidad se introdujeron en la sección 4.6, como un método informal pa¬ 
ra evaluar la posibilidad de cualquier distribución poblacional especificada como aquella de 
la que se seleccionó la muestra dada. Cuanto más recta sea la gráfica de probabilidad, más 
plausible es la distribución en la que está basada la gráfica. Una gráfica de probabilidad nor¬ 
mal se emplea para verificar si cualquier miembro de la familia de distribución normal 
es posible. Denótese las x¡ muéstrales cuando sean ordenadas de menor a mayor por jc (1) , 
X( 2 ), ■ ■ ■ , x (n) . Entonces la gráfica sugerida para verificar normalidad fue una gráfica de los 
puntos (x (l) , y¡), donde y¡ = — 0.5)/n). 

Una medida cuantitativa de la magnitud a la que los puntos se agrupan alrededor de 
una recta es el coeficiente r de correlación muestral introducido en el capítulo 12. Conside¬ 
re calcular r para los n pares (x lip y¡), . . . , (x {n) , y n ). Las y¡ aquí no son valores observados 
en una muestra aleatoria de una población y, de modo que las propiedades de esta r son muy 
diferentes a las descritas en la sección 12.5. No obstante, es cierto que cuanto más se des¬ 
víe r de 1, menor es la probabilidad de que la gráfica se asemeje a una recta (recuerde que 
una gráfica de probabilidad debe tener pendiente ascendente). Esta idea también se puede 
extender para obtener un procedimiento formal de prueba: rechazar la hipótesis de norma¬ 
lidad poblacional si r < c a , donde c a es un valor crítico seleccionado para obtener el nivel a 
deseado de significación. Esto es, el valor crítico se selecciona de modo que cuando la dis¬ 
tribución poblacional sea normal en realidad, la probabilidad de obtener un valor r que sea 
a lo sumo c a (y así rechazar incorrectamente H 0 ) es la a deseada. Los creadores del paque¬ 
te estadístico MINITAB dan valores críticos para a = 0.10, 0.05 y 0.01 en combinación con 
tamaños muéstrales diferentes. Estos valores críticos están basados en una definición lige¬ 
ramente diferente de las y¡ que las dadas antes. 

MINITAB también construirá una gráfica de probabilidad normal con estas y¡. La grá¬ 
fica tendrá un aspecto casi idéntico al basado en las y¡ previas. Cuando haya varias x (¡) empa¬ 
tadas, MINITAB calcula r usando el promedio de las y¡ correspondientes como el segundo 
número de cada par. 


Sea y¡ = <í> 1 [(i — 0.375)/(« + 0.25)] y calcule el coeficiente r de correlación mues¬ 
tral para los n pares (x U) , y/), . . . , (x ln) , y„). La prueba Ryan-Joiner de 

H 0 : la distribución poblacional es normal 

en función de 

H ñ : la distribución poblacional no es normal 

consiste en rechazar H 0 cuando r < c a . Los valores críticos c a se dan en la tabla A. 12 
del apéndice para diversos niveles a de significación y tamaños muéstrales n. 


Ejemplo 14.12 La siguiente muestra de n = 20 observaciones sobre voltaje de ruptura dieléctrico de una 
pieza de resina epóxica apareció primero en el ejemplo 4.29. 


y ¡ 

- 1.871 

- 1.404 

- 1.127 

- 0.917 

- 0.742 

- 0.587 

- 0.446 

- 0.313 

- 0.186 

- 0.062 

x «) 

24.46 

25.61 

26.25 

26.42 

26.66 

27.15 

27.31 

27.54 

27.74 

27.94 

y ¡ 

0.062 

0.186 

0.313 

0.446 

0.587 

0.742 

0.917 

1.127 

1.404 

1.871 

% 

27.98 

28.04 

28.28 

28.49 

28.50 

28.87 

29.11 

29.13 

29.50 

30.88 
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Se pidió a MINITAB que realizara la prueba de Ryan-Joiner, y el resultado aparece en la fi¬ 
gura 14.3. El valor del estadístico de prueba es r = 0.9881 y la tabla A. 12 del apéndice da 
0.9600 como el valor crítico que captura el área de cola inferior 0.10, bajo la curva de dis¬ 
tribución muestral r cuando n = 20 y la distribución básica en realidad es normal. Como 
0.9881 > 0.9600, la hipótesis nula de normalidad no puede ser rechazada incluso para un 
nivel de significación de hasta 0.10. 


Normal Probability Plot 



StdDev. 145186 R 0.9881 

Nofdata20 p valué (aprox).>0.0100 

Figura 14.3 Salida de MINITAB de la prueba Ryan-Joiner para los datos del ejemplo 14 . 12 . 


EJERCICIOS Sección 14.2 (12-23) 


12. Considere una gran población de familias en la que cada 
una tiene exactamente tres hijos. Si los géneros de los tres 
hijos de cualquier familia son independientes entre sí, el nú¬ 
mero de hijos hombres de una familia seleccionada al azar 
tendrá una distribución binomial basada en tres intentos, 
a. Suponga que una muestra aleatoria de 160 familias da 
los resultados siguientes. Pruebe las hipótesis relevantes 
procediendo como en el ejemplo 14.5. 


Número de 
hijos hombres 

0 12 3 

Frecuencia 

14 66 64 16 


b. Suponga que una muestra aleatoria de familias de una 
población que no es de seres humanos dio como resultado 
frecuencias observadas de 15, 20, 12 y 3, respectivamen¬ 
te. ¿La prueba ji cuadrada estaría basada en el mismo 
número de grados de libertad que la prueba del inciso al 
Explique. 

13. Un estudio de esterilidad en moscas de la fruta (“Hybrid Dys- 
genesis in Drosophila melanogaster: The Biology of Female 
and Male Sterility”, Genetics, 1979: 161-174) publica los da¬ 
tos siguientes sobre el número de ovarios desarrollados por 
cada mosca hembra en una muestra de 1388. Un modelo de 
esterilidad unilateral expresa que cada ovario se desarrolla 


con alguna probabilidad p, independientemente del otro ova¬ 
rio. Pruebe el ajuste de este modelo usando \ 2 - 


x = Número de 




ovarios desarrollados 

0 

1 

2 

Cantidad observada 

1212 

118 

58 


14. El artículo “Feeding Ecology of the Red-Eyed Vireo and 
Associated Foliage-Gleaning Birds” ( Ecological Mono- 
graphs, 1971: 129-152) presenta los datos siguientes sobre 
la variable X = número de saltos antes del primer vuelo y 
precedido de un vuelo. El autor propuso y ajustó entonces 
una distribución de probabilidad geométrica [p(x) = P(X = 
x) = p x ~ l • q para x = 1,2,..., donde q = 1 — p] a los da¬ 
tos. El tamaño total muestral fue n = 130. 


X 

12 3 4 

5 6 

7 8 9 

10 

11 12 

Número de 
veces de x 

48 31 20 9 

6 5 

4 2 1 

1 

2 1 

observada 

a. La pi 

obabilidad es (p x '~ l 

■<?)•' 

■ ■ • ( p x 

<7) = 

pHx-n . 


q". Demuestre que los estimadores de máxima verosimi¬ 
litud de p está dada por p = {Y,x ¡ — n)lY.x¡, y calcule p 
para la información dada. 
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586 

b. Estime las cantidades esperadas de celdas usando p del 
inciso a [cantidades esperadas de celda = n • (pY^ 1 • q 
para x = 1 , 2 , . . . ], y pruebe el ajuste del modelo usan¬ 
do una prueba \ 2 al combinar las cantidades para x = 7, 
8 , . . . , y 12 en una celda (x a 7). 

15. Cierto tipo de linterna eléctrica se vende con las cuatro ba¬ 
terías incluidas. Se obtiene una muestra aleatoria de 150 
linternas y se determina el número de baterías defectuosas; 
con los resultados siguientes: 


Número defectuoso 

0 

1 

2 

3 

4 

Frecuencia 

26 

51 

47 

16 

10 


Sea X el número de baterías defectuosas de una linterna se¬ 
leccionada al azar. Pruebe la hipótesis nula de que la distri¬ 
bución de X es Bin(4, 0). Esto es, con p¡ = P(i defectuosas), 
pruebe 

H 0 : Pí = (*í) A'O - 0) 4 ~‘ i = 0. 1, 2, 3, 4 

[Sugerencia: Para obtener los estimadores de máxima vero¬ 
similitud de 0 , escriba la probabilidad (la función a ser ma- 
ximizada) como 0 "( 1 — 0 ) v , donde los exponentes u y v son 
funciones lineales de las cantidades de celdas. Luego tome 
el logaritmo natural, derive con respecto a 0 , iguale a cero el 
resultado y despeje 0 .] 

16. En un experimento de genética, unos investigadores obser¬ 
varon 300 cromosomas de un tipo particular y contaron el 
número de intercambios de hermana cromátida en cada uno 
(“On the Nature of Sister-Chromatid Exchanges in 5-Bro- 
modeoxyuridine-Substituted Chromosomes”, Genetics, 
1979: 1251-1264). Se teorizó un modelo Poisson para la 
distribución del número de intercambios. Pruebe el ajuste 
de una distribución Poisson a los datos estimando primero 
A y luego combinando las cantidades para x = 8 y x = 9 en 
una celda. 

X - Número de 

intercambios 0123456789 

Cantidades 

observadas 6 24 42 59 62 44 41 14 6 2 

17. Un artículo en Annals of Mathematical Statistics publica los 
siguientes datos sobre el número de taladradores, de 120 , en 
cada uno de los grupos de taladradores. ¿La función masa 
de probabilidad de Poisson da un modelo posible para la 
distribución del número de taladradores en un grupo? [5 ¡í- 
gerencia: Sume las frecuencias para 7, 8 , . . . ,12 para es¬ 
tablecer una sola categoría “ S 7”.] 


Número de 
taladradores 

0 1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 12 

Frecuencia 

24 16 

16 

18 

15 

9 

6 

5 

3 

4 

3 

0 1 


18. El artículo “A Probabilistic Analysis of Dissolved Oxygen- 
Biochemical Oxygen Demand Relationship in Streams” 
(./. Water Resources Control Fed., 1969: 73-90) publica datos 
sobre la rapidez de oxigenación en arroyos a 20°C en cierta 
región. La media muestral y desviación estándar se calcula¬ 
ron como x = 0.173 y s = 0.066, respectivamente. Con base 
en la distribución de frecuencia siguiente, ¿puede concluir¬ 
se que la rapidez de oxigenación es una variable normalmen¬ 
te distribuida? Use la prueba ji cuadrada con a = 0.05. 


Rapidez (por día) 

Frecuencia 

Abajo de 0.100 

12 

0.100-abajo de 0.150 

20 

0.150-abajo de 0.200 

23 

0.200-abajo de 0.250 

15 

0.250 o más 

13 


19. Cada faro delantero de un auto sometido a inspección anual 
puede enfocarse ya sea demasiado alto ( H ), demasiado bajo 
(L), o bien (N). La verificación de los dos faros simultánea¬ 
mente (y sin distinguir entre izquierdo y derecho) da los 
seis posibles resultados HH, LL, NN, HL, HN y LN. Si las 
posibilidades (proporciones poblacionales) para la direc¬ 
ción de enfoque de un solo faro son P(H) = 6 l , P(L) = 0,, 
y P(N) = 1 — 0¡ — 07 , y si los dos faros se enfocan de modo 
independiente uno del otro, las probabilidades de los seis re¬ 
sultados para un auto seleccionado al azar son las siguientes: 

Pi = 6 ? Pi = e l Pi = (1 “ 0i - 0 2 ) 2 

p 4 = 20 J 0 , p 5 = 20 j(l - 0 , - 0 2 ) 

p 6 = 20 2 (1 - 0 ! - 0 2 ) 

Use los datos siguientes para probar la hipótesis nula 

H 0 - Pi = ^ 1(60 °i)’ ■ ■ ■ > Pe = d i) 
donde las •7 t i ( 0 1 ,0 2 ) se dieron previamente. 


Resultado 

HH 

LL 

NN 

HL 

HN 

LN 

Frecuencia 

49 

26 

14 

20 

53 

38 


[Sugerencia: Escriba la probabilidad como una función de 
0 ! y 6o, tome el logaritmo natural, luego calcule d/30 l5 y 
d/30 2 , iguálelas a cero y despeje 0 ¡, 0 ,.] 

20. El artículo “Compatibility of Outer and Fusible Interlining 
Fabrics in Tailored Garments” (Textile Res. J., 1997: 137-142) 
dio las siguientes observaciones en rigidez al doblamiento 
(¿iN • m) para especímenes de telas de mediana calidad, de 
las cuales se obtuvo la salida MINITAB siguiente: 


24.6 

12.7 

14.4 

30.6 

16.1 

9.5 

31.5 

17.2 

46.9 

68.3 

30.8 

116.7 

39.5 

73.8 

80.6 

20.3 

25.8 

30.9 

39.2 

36.8 

46.6 

15.6 

32.3 



Normal Probability Plot 



Average 37.4217 West for Normality 

StdDev. 258101 R 0.9116 


N of Data 23 p valué (aprox.)> 0.0100 
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¿Usaría el lector un intervalo de confianza t de una muestra 
para estimar un promedio verdadero de rigidez al dobla- 
miento? Explique su razonamiento. 

21. El artículo del que se obtuvo la información del ejercicio 20 
también dio los datos siguientes sobre la proporción de ma¬ 
sa compuesta/masa de tela exterior) para especímenes de te¬ 
la de alta calidad. 


1.15 

1.40 

1.34 

1.29 

1.36 

1.26 

1.22 

1.40 

1.29 

1.41 

1.32 

1.34 

1.26 

1.36 

1.36 

1.30 

1.28 

1.45 

1.29 

1.28 

1.38 

1.55 

1.46 

1.32 


MINITAB dio r = 0.9852 como el valor del estadístico de 
prueba Ryan-Joiner e indicó que el valor P es > 0.10. ¿El 
lector utilizaría la prueba t de una muestra para probar las 
hipótesis acerca del valor del verdadero promedio de la re¬ 
lación? ¿Por qué sí o por qué no? 

22. El siguiente conjunto de datos consta de 25 observaciones 
sobre tenacidad a la fractura de placas de fondo, de acero de 
18% de níquel para producir martensita exenta de carbono 
(de “Fracture Testing of Weldments”, ASTM Special Publ. 


14.3 Tablas de contingencia mutuas (o bidireccionales) 587 

No. 381. 1965: 328-356). Utilice la prueba de coeficiente de 
correlación de la gráfica de probabilidad normal, para deter¬ 
minar si una distribución normal da un modelo posible pa¬ 
ra tenacidad a la fractura. 


69.5 

71.9 

72.6 

73.1 

73.3 

73.5 

74.1 

74.2 

75.3 

75.5 

75.7 

75.8 

76.1 

76.2 

76.9 

77.0 

77.9 

78.1 

79.6 

79.7 

79.9 

80.1 

82.2 

83.7 

93.7 




23. El artículo “Nonbloated Burned Clay Aggregate Concrete” 
(7. Materials, 1972: 555-563) publica los siguientes datos 
sobre resistencia flexional de 7 días, de muestras de concre¬ 
to con agregado de arcilla quemada sin curar (en libras por 
pulgada cuadrada, psi): 


257 

327 

317 

300 

340 

340 

343 

374 

377 

386 

383 

393 

407 

407 

434 

427 

440 

407 

450 

440 

456 

460 

456 

476 

480 

490 

497 

526 

546 

700 


Pruebe al nivel 0.10 para determinar si la resistencia flexio¬ 
nal es una variable distribuida normalmente. 


14.3 Tablas de contingencia mutuas (o bidireccionales) 


En las dos secciones previas, se estudiaron problemas inferenciales en los que los datos de 
cantidades se mostraba en una tabla rectangular de celdas. Cada tabla estaba formada por 
una fila y un número especificado de columnas, donde las columnas correspondían a cate¬ 
gorías en las que la población se había dividido. Ahora se estudian problemas en los que los 
datos también están formados por cantidades o frecuencias, pero la tabla de información 
ahora tendrá I filas (I > 2) y J columnas, por tanto IJ celdas. Hay dos situaciones que por 
lo general se encuentran y en las que se muestran los datos: 

1. Hay I poblaciones de interés, cada una correspondiente a una fila diferente de la tabla, y 
cada población está dividida en las mismas J categorías. Se toma una muestra de la i-ési- 
ma población (i = 1, . . . , 7) y las cantidades se introducen en las celdas de la i-ésima 
fila de la tabla. Por ejemplo, los clientes de cada una de las I = 3 cadenas de tiendas de¬ 
partamentales podrían disponer de las mismas J = 5 categorías de pago: contado, che¬ 
que, tarjeta de crédito de la tienda, Visa y MasterCard. 

2. Hay una sola población de interés, con cada individuo de la población clasificado con 
respecto a dos factores diferentes. Hay I categorías asociadas con el primer factor, y J ca¬ 
tegorías asociadas con el segundo factor. Se toma una sola muestra, y el número de indi¬ 
viduos pertenecientes tanto a la categoría i del factor 1 como a la categoría j del factor 2 
se introduce en la celda de la fila i, columna j (i = 1, j = 1,...,/). Como ejem¬ 
plo, los clientes que hagan una compra podrían clasificarse de acuerdo con el departa¬ 
mento en el que hicieron la compra, con 1=6 departamentos, y de acuerdo con la forma 
de pago, con J = 5 como en (1) de líneas antes. 

Denótese con n- el número de individuos de la(s) muestra(s) que caen en la (/, /j-ésima cel¬ 
da (fila i, columna j) de la tabla, es decir, la (i, j) cantidad de celda. La tabla que presente 
las n¡j se denomina tabla de contingencia mutua; un prototipo se muestra en la tabla 14 . 9 . 
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Tabla 14.9 Una tabla de contingencia mutua 


i 2 ... j ... j 


”11 

«12 


n v 


«1 J 

«21 












«¡1 



n ij 









«71 





«7 J 



En situaciones del tipo 1, se desea investigar si las proporciones de las diferentes ca¬ 
tegorías son iguales para todas las poblaciones. La hipótesis nula expresa que las poblacio¬ 
nes son homogéneas con respecto a estas categorías. En situaciones del tipo 2, se investiga 
si las categorías de los dos factores se presentan independientemente una de otra en la po¬ 
blación. 

Prueba de homogeneidad 

Se supone que cada uno de los individuos de las poblaciones I pertenece exactamente a una 
de las J categorías. Una muestra de n¡ individuos se toma de la ¡-ésima población; sea 
n = 2n i y 

n¡j = número de individuos de la ¡-ésima muestra que cae en la categoría j 

X número total de individuos entre la n 
n 'i j ] n,J muestreada que cae en la categoría j 

Las n¡j se registran en una tabla de contingencia mutua con I filas y J columnas. La suma de 
las n¡j de la ¡-ésima fila es n¡, mientras que la suma de entradas de la j-ésima columna es n. r 
Sea 



proporción de individuos de la 
P‘J población i que cae en la categoría j 

Así, para la población 1, las proporciones J son p n , p l2 , . . . , p u (que suman 1) y análoga¬ 
mente para otras poblaciones. La hipótesis nula de homogeneidad expresa que la propor¬ 
ción de individuos de la categoría j es la misma para cada población y que esto es cierto para 
toda categoría, es decir, j, = p 2j = ■ ■ ■ = p lr 

Cuando H 0 es verdadera, se puede usar p v p 2 , . . . , p f para denotar las proporciones 
poblacionales de las J categorías diferentes; estas proporciones son comunes para todas 
las poblaciones I. El número esperado de individuos en la ¡-ésima muestra que cae en la 
/-ésima categoría cuando H 0 es verdadera es entonces E(N i] ) = n¡ • p-. Para estimar LYAT ), 
primero se debe estimar p-, la proporción de la categoría j. Entre la muestra total de n indi¬ 
viduos, N.j cae en la categoría j, de modo que se usa p- = N.j/n como el estimador (se pue¬ 
de demostrar que éste es el estimador de máxima verosimilitud de pj). La sustitución de la 
estimación p¡ para p f en np¡ da una fórmula sencilla para cantidades esperadas estimadas 
bajo H 0 : 
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yv n ■ 

e n = cantidad esperada estimada en celda (/', f) = n¡ — L 
1 n 

(total de í-ésima fila)(total de /’-ésima columna) 

n 


(14.9) 


El estadístico de prueba también tiene la misma forma que en las situaciones del problema 
previo. El número de grados de libertad proviene de la regla empírica general. En cada fila 
de la tabla 14.9 hay 7—1 cantidades de celdas determinadas libremente (cada tamaño 
muestral n¡ es fijo), de modo que hay un total de 7(7 — 1) celdas determinadas libremente. 
Los parámetros p x , ... ,pj se estiman, pero como Y.p, = 1, sólo 7 — 1 de éstos son inde¬ 
pendientes. Por lo tanto, el grado de libertad es gl = 7(7 — 1) — (7 — 1) = (7 — 1)(/ — 1). 




Hipótesis nula: 77 0 : p xj = p 2 ¡ = ■ ■ ■ = p,j j = 1, 2, . . . , 7 
Hipótesis alternativa: 77 a : 77 0 no es verdadera 
Valor de estadístico de prueba: 


(observada — esperada estimada) 2 
todas las celdas esperada estimada 


= 2 2 

¿=17=1 


("o 


e) 2 


Región de rechazo: * 2 > a£ ( í _ 1)(J _ 1} 

La información del valor P se puede obtener como se describe en la sección 14.1. 
La prueba se puede aplicar con seguridad mientras éy & 5 para todas las celdas. 




Ejemplo 14.13 Una compañía empaca un producto particular en latas de tres tamaños diferentes, cada uno 
con una línea de producción distinto. La mayor parte de las latas se apegan a especificacio¬ 
nes, pero un ingeniero de control de calidad ha identificado las siguientes razones de no 
cumplimiento de especificaciones: 

1. Defecto en lata 

2. Grieta en lata 

3. Ubicación incorrecta de arillo 

4. Arillo faltante 

5. Otras 

Se selecciona una muestra de unidades fuera de especificación de cada una de las tres líneas 
de producción, y cada unidad se clasifica según la razón por la que están fuera de especifi¬ 
cación; dio por resultado la siguiente información de tabla de contingencia: 


Razón para estar fuera de especificación 
- Tamaño 



Defecto 

Grieta 

Ubicación 

Faltante 

Otras 

muestral 

1 

34 

65 

17 

21 

13 

150 

2 

23 

52 

25 

19 

6 

125 

3 

32 

28 

16 

14 

10 

100 

Total 

89 

145 

58 

54 

29 

375 


Línea de 
producción 
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¿Sugiere la información que las proporciones que caen en las diversas categorías de fuera 
de especificación no son iguales para las tres líneas? Los parámetros de interés son las di¬ 
versas proporciones, y las hipótesis relevantes son 

H 0 : las líneas de producción son homogéneas con respecto a las cinco categorías 
de fuera de especificación; es decir, p , ; = p 2j = Py para j = 1, . . . , 5 

IIp. las líneas de producción no son homogéneas con respecto a las categorías 

Las frecuencias esperadas estimadas (suponiendo homogeneidad) deben calcularse ahora. 
Considere la primera categoría fuera de especificación para la primera línea de producción. 
Cuando las líneas son homogéneas, 

número esperado estimado entre las 150 unidades seleccionadas echadas a perder 

(total primer fila)(total primera columna) (150)(89) 

= - = - = 35.60 

total de tamaños muéstrales 375 

La contribución de la celda de la esquina superior izquierda a x 2 es entonces 

(observada — esperada estimada) 2 (34 — 35.60) 2 
esperada estimada 35.60 

Las otras contribuciones se calculan de manera semejante. La figura 14.4 muestra una salida 
MINITAB para la prueba de ji cuadrada. La cantidad observada es el número de la parte su¬ 
perior de cada celda, y directamente debajo de ella está la cantidad esperada estimada. La 
contribución de cada celda a x 2 aparece debajo de las cantidades, y el valor del estadístico de 
prueba es x 2 = 14.159. Todas las cantidades esperadas estimadas son al menos 5, de modo 
que no es necesario combinar categorías. La prueba está basada en (3 — 1)(5 — 1) = 8 gra¬ 
dos de libertad. La tabla A. 11 del apéndice muestra que los valores que capturan las 
áreas de cola superior de 0.08 y 0.075 bajo la curva de 8 grados de libertad son 14.06 y 
14.26, respectivamente. Por tanto, el valor P está entre 0.075 y 0.08; MINITAB da un valor 
P = 0.079. La hipótesis nula de homogeneidad no debe ser rechazada a los niveles de sig¬ 
nificación usuales de 0.05 y 0.01, pero debe ser rechazada para a mayor a 0.10. 



Expected counts are printed below observed counts 



blem 

crack 

loe 

missing 

other 

Total 

1 

34 

65 

17 

21 

13 

150 


35.60 

58.00 

23.20 

21.60 

11.60 


2 

23 

52 

25 

19 

6 

125 


29.67 

48.33 

19.33 

18.00 

9.67 


3 

32 

28 

16 

14 

10 

100 


23.73 

38.67 

15.47 

14.40 

7.73 


Total 

89 

145 

58 

54 

29 

375 


Chisq = 0.072 + 0.845 + 1.657 + 0.017 + 0.169 + 1.498 + 0.278 + 
1.661 + 0.056 + 1.391 + 2.879 + 2.943 + 0.018 + 0.011 + 
0.664 = 14.159 


df = 8, p = 0.079 

Figura 14.4 Salida de MINITAB para la prueba ji cuadrada del ejemplo 14.13. 


Prueba de independencia 

Ahora el tema se concentra en la relación entre dos factores diferentes de una población in¬ 
dividual. El número de categorías del primer factor estará denotado por I y el número de ca¬ 
tegorías del segundo factor por J. Se supone que cada individuo de la población pertenece 
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a exactamente una de las I categorías, asociada con el primer factor, y exactamente una de 
las J categorías asociada con el segundo factor. Por ejemplo, la población de interés podría 
estar formada por todos los individuos que por lo regular ven por televisión las noticias na¬ 
cionales de Estados Unidos, en el que el primer factor es una red preferida (ABC, CBS, 
NBC o PBS, de modo que I = 4) y el segundo factor la filosofía política (liberal, modera¬ 
do, o conservador, que da J = 3). 

Para una muestra de n individuos tomados de la población, denote con n :¡ el número 
entre los n que caen en la categoría i del primer factor y la categoría j del segundo factor. 
Las n¡j se pueden exhibir en una tabla de contingencia mutua con I filas y J columnas. En el 
caso de homogeneidad para I poblaciones, los totales de fila se fijaron por anticipado, y só¬ 
lo los totales de la columna J fueron aleatorios. Ahora sólo el tamaño muestral total es fijo, 
y las n¡. y n ■ son valores observados de variables aleatorias. Para expresar las hipótesis de 
interés, sea 

p¡j = la proporción de individuos de la población que pertenece a la categoría i del 
factor 1 y a la categoría j del factor 2 

= P(un individuo seleccionado al azar cae en la categoría i del factor 1 y en la 
categoría y del factor 2) 

Entonces 

p¡. = A,p¡j = P(un individuo seleccionado al azar cae en la categoría i del factor 1) 

i 

p.j = X P¡j = P(un individuo seleccionado al azar cae en la categoría y del factor 2) 
i 

Recuerde que dos eventos Ay B son independientes si P(A í) B) = P(A ) • P{B). La hipóte¬ 
sis nula aquí dice que la categoría de un individuo con respecto al factor 1 es independien¬ 
te de la categoría con respecto al factor 2. En símbolos, esto se convierte en p¡. = p¡. • p. 
para todo par (i, y). 

La cantidad esperada en la celda (i, y) es n • p-, de modo que cuando la hipótesis nu¬ 
la sea verdadera, E(N¡¡) = n • p¡. • p_-. Para obtener un estadístico ji cuadrada, se debe esti¬ 
mar por tanto las p¡. (i = 1, . . . , 7) y p_. (j = 1, . . . , f). Las estimadores de máxima 
verosimilitud son 



/v n 

p¡. = —^ = proporción muestral para la categoría i del factor 1 
n 


/V Ai ■ 

p- = — L = proporción muestral para la categoría J del factor 2 

‘J n 


Esto da cantidades de celda esperadas estimadas idénticas a las del caso de homogeneidad. 


e a = n • Pi- • P-i = n ' 


n n n 

(total de í'-ésima fila)(total dey-ésima columna) 
n 


El estadístico de prueba también es idéntico al empleado en pruebas de homogeneidad, co¬ 
mo es el número de grados de libertad. Esto es porque el número de cantidades de celda 
determinadas libremente es IJ — 1, porque sólo el n total se fija por anticipado. Hay I de 
p ¡. estimadas, pero sólo 7—1 son estimadas de manera independiente porque Xp,-. = 1, 





















cl4_p568-598.qxd 3/12/08 4:37 AM Page 592 



592 CAPÍTULO 14 Pruebas de bondad de ajuste y análisis de datos categóricos 

y, análogamente J — 1 de las p.¡ son estimadas de manera independiente, de modo que 
I + J — 2 parámetros se estiman independientemente. La regla empírica ahora da grados de 
libertad = 1J - 1 - (/ + J - 2) = IJ - I - J + 1 = (7 - 1) • (7 - 1). 


Hipótesis nula: //„: p Lj = p¡. • p.¡ i = 1, . . . , I;j = 1, . . . , J 
Hipótesis alternativa: // a : H 0 no es verdadera 
Valor de estadístico de prueba: 

2 (observada — esperada estimada) 2 ( n g ~ G;) 2 

todas las celdas esperada estimada <=i/=t 

Región de rechazo: * 2 > A / ^ (í _ 1)(y _ 1) 

De nuevo, la información del valor P se puede obtener como se describe en la sec¬ 
ción 14.1. La prueba puede aplicarse con seguridad mientras e- > 5 para todas las 
celdas. 



Ejemplo 14.14 Un estudio de la relación entre las condiciones del equipo de gasolinerías y la agresividad 
en precios de gasolina (“An Analysis of Price Aggresiveness in Gasoline Marketing”, 
J. Marketing Research, 1970: 36-42) publica la siguiente información basada en una mues¬ 
tra de n = 441 gasolinerías. Al nivel 0.01, ¿sugiere la información que las condiciones del 
equipo y la política de precios son independientes entre sí? Las cantidades observadas y es¬ 
peradas estimadas se dan en la tabla 14.10. 

Tabla 14.10 Cantidades observadas y esperadas estimadas para el ejemplo 14.14 


Política de precios observada 

Agresiva Neutral No agresiva Política de precios esperada 


Abajo de 
estándar 

24 

15 

17 

"i- 

56 

17.02 

22.10 

16.89 

56 

Condición Estándar 

52 

73 

80 

205 

62.29 

80.88 

61.83 

205 

Moderna 

58 

86 

36 

180 

54.69 

71.02 

54.29 

180 

n-i 

134 

174 

133 

441 

134 

174 

133 

441 



Por tanto 


= (24 - 17.02) 2 (36 ~ 54.29) 2 = ^ 

K 17.02 54.29 

y como Xooi 4 = 13.277, la hipótesis de independencia se rechaza. 

La conclusión es que el conocimiento de la política de precios de una gasolinería da 
información acerca de las condiciones del equipo de la gasolinería. En particular, parece que 
es más probable que las gasolinerías con agresiva política de precios tengan equipo abajo 
del estándar que las que tienen política neutral o no agresiva. ■ 

Los modelos y métodos para analizar datos, en los que cada individuo es clasificado 
con respecto a tres o más factores (tablas de contingencia multidimensionales), se estudian 
en varias de las referencias de este capítulo. 
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EJERCICIOS Sección 14.3 (24-36) 


24. La tabla bidireccional siguiente se construyó usando datos 
del artículo “Televisión Viewing and Physical Fitness in 
Adults” (Research Quarterly for Exercise and Sport, 1990: 
315-320). El autor esperaba determinar si el tiempo que la 
gente pasaba viendo televisión estaba asociado con las con¬ 
diciones físicas cardiovasculares. A los sujetos se les pre¬ 
guntó sobre sus hábitos de ver televisión y se clasificaron 
como físicamente en buenas condiciones si entraban en la 
categoría de excelente o muy buena en un examen de ca¬ 
minata. Aquí se incluye una salida de MINITAB de un 
análisis ji cuadrada. Los cuatro grupos que ven televi¬ 
sión corresponden a diferentes cantidades de tiempo por día 
dedicados a ver TV (0, 1-2, 3-4 o 5 o más horas). Los 168 
individuos representados en la primera columna fueron los 
que se evaluaron en buenas condiciones físicas. Las cantida¬ 
des esperadas aparecen abajo de las cantidades observadas, 
y MINITAB exhibe la contribución a x 2 desde cada celda. 
Exprese y pruebe las hipótesis apropiadas usando a = 0.05. 



1 

2 

Total 

1 

35 

147 

182 


25.48 

156.52 


2 

101 

629 

730 


102.20 

627.80 


3 

28 

222 

250 


35.00 

215.00 


4 

4 

34 

38 


5.32 

32.68 


Total 

168 

1032 

1200 


ChiSq = 3.557 + 0.579 + 

0.014 + 0.002 + 

1.400 + 0.228 + 

0.328 + 0.053 = 6.161 

df = 3 


25. La información siguiente se refiere a marcas en hojas halla¬ 
das en muestras de trébol blanco seleccionadas de regiones 
de pastos largos y pastos cortos. (“The Biology of the Leaf 
Mark Polymorphism in Trifolium repens L.”, Heredity, 
1976: 306-325). Use una prueba \ 2 para determinar si las 
proporciones verdaderas de marcas diferentes son idénti¬ 
cas para los dos tipos de regiones. 


Tipo de marca Tamaño 

L LL Y + YL O Otras muestral 

Regiones 
de pasto 
largo 
Regiones 
de pasto 
corto 

26. La siguiente información resultó de un experimento para 
estudiar los efectos del corte de hojas en la capacidad de la 
fruta de cierto tipo para madurar (“Fruit Set, Herbivory, 


409 

11 

22 

7 

277 

512 

4 

14 

11 

220 


Fruit Reproduction, and the Fruiting Strategy of Catalpa 


speciosa”, Ecology, 1980: 

Tratamiento 

57-64): 

Número 

de frutas 

maduras 

Número 

de frutas 

abortadas 

Control 

141 

206 

Dos hojas removidas 

28 

69 

Cuatro hojas removidas 

25 

73 

Seis hojas removidas 

24 

78 

Ocho hojas removidas 

20 

82 


¿La información sugiere que la probabilidad de que madu¬ 
re una fruta es afectada por el número de hojas removidas? 
Exprese y pruebe las hipótesis apropiadas al nivel 0.01. 

27. El artículo “Human Lateralization from Head to Foot: Sex- 
Related Factors” ( Science , 1978: 1291-1292) informa que 
para una muestra de hombres derechos y una muestra de 
mujeres derechas, el número de individuos cuyos pies eran 
del mismo tamaño, tenían el pie izquierdo más grande que el 
pie derecho (una diferencia de medio punto en el calzado o 
más), o tenían el pie derecho más grande que el izquierdo. 

Tamaño 

I>D I = D I<D muestra 


40 


87 


Hombres 

Mujeres 


2 

10 

28 

55 

18 

14 


¿La información indica que el género tiene un fuerte efecto 
en el desarrollo de asimetría en pies? Exprese las hipótesis 
nula y alternativa apropiadas, calcule el calor de \ 2 , y ob¬ 
tenga información acerca del valor P. 

28. El artículo “Susceptibility of Mice to Audiogenic Seizure Is 
Increased by Handling Their Dams During Gestation” 
(Science, 1976: 427-428) informa sobre una investigación 
del efecto de tratamientos, con diferentes inyecciones, so¬ 
bre las frecuencias de convulsiones audiogénicas. 


Tratamiento 

Sin Correr 

respuesta alocado 

Convul¬ 

sión 

clónica 

Convul¬ 

sión 

tónica 

Tienilalanina 

21 

7 

24 

44 

Disolvente 

15 

14 

20 

54 

Simulado 

23 

10 

23 

48 

No manejado 

47 

13 

28 

32 
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¿La información sugiere que los verdaderos porcentajes de 
las diferentes categorías de respuesta dependen de la natu¬ 
raleza del tratamiento con inyecciones? Exprese y pruebe 
las hipótesis apropiadas usando a = 0.005. 

29. La información siguiente sobre combinaciones de sexo de 
dos recombinantes (individuos con nuevas combinaciones 
de genes), que resultan de seis genotipos masculinos dife¬ 
rentes, aparece en el artículo “A New Method for Distin- 
guishing Bctween Meiotic and Premeiotic Recombinational 
Events in Drosophila melanogaster ” ( Genetics , 1979: 543- 
554). ¿La información apoya la hipótesis de que la distribu¬ 
ción de frecuencia, entre las tres combinaciones de sexo, es 
homogénea con respecto a los diferentes genotipos? Defina 
los parámetros de interés, exprese las H 0 y apropiadas y 
efectúe el análisis. 


Combinación de sexo 




M/M 

M/F 

F/F 


1 

35 

80 

39 


2 

41 

84 

45 

Genotipo 

3 

33 

87 

31 

masculino 

4 

8 

26 

8 


5 

5 

11 

6 


6 

30 

65 

20 


30. Se consideran tres configuraciones diferentes de diseño pa¬ 
ra un componente particular. Hay cuatro posibles modos de 
falla para el componente. Un ingeniero obtuvo la informa¬ 
ción siguiente sobre el número de fallas en cada modo, para 
cada una de las tres configuraciones. ¿La configuración pa¬ 
rece tener efecto sobre el tipo de falla? 

Modo de falla 



1 

2 

3 

4 

1 

20 

44 

17 

9 

Configuración 2 

4 

17 

7 

12 

3 

10 

31 

14 

5 


31. En una zona metropolitana grande, se obtuvo una muestra 
aleatoria de individuos que van solos en auto al trabajo y ca¬ 
da uno de ellos se clasificó con respecto al tamaño de su au¬ 
to y la distancia de viaje. ¿La siguiente información sugiere 
que la distancia de viaje y el tamaño del auto están relacio¬ 
nados en la población muestreada? Exprese las hipótesis 
apropiadas y use una prueba ji cuadrada de nivel de 0.05. 


Subcompacto 


Tamaño Compacto 
de auto 

Mediano 


Grande 


Distancia de viaje 


0-<10 

10-<20 

>20 

6 

27 

19 

8 

36 

17 

21 

45 

33 

14 

18 

6 


32. Cada uno de los estudiantes de una muestra aleatoria de 
estudiantes, de preparatoria y universidad, se clasificó con 
respecto a puntos de vista políticos y consumo de marihua¬ 
na; los datos resultantes se presentan en la tabla bidireccio- 
nal siguiente (“Attitudes About Marijuana and Political 
Views”, Psychological Reports, 1973: 1051-1054). ¿La in¬ 
formación apoya la hipótesis de que los puntos de vista polí¬ 
ticos y el nivel de consumo de marihuana son independientes 
dentro de la población? Pruebe las hipótesis apropiadas 
usando el nivel de significación 0.01. 


Puntos 
de vista 
políticos 


Nivel de consumo 



Nunca 

Rara vez 

Con frecuencia 

Liberal 

479 

173 

119 

Conservador 

214 

47 

15 

Otro 

172 

45 

85 


33. Demuestre que el estadístico ji cuadrada para la prueba de 
independencia se puede escribir en la forma 



¿Por qué esta fórmula es más eficiente computacionalmen- 
te que la fórmula de definición para ^ 2 ? 

34. Suponga que, en el ejercicio 32, cada uno de los estudian¬ 
tes ha sido clasificado con respecto a simpatía política, con¬ 
sumo de marihuana y preferencia religiosa, con respecto a 
las categorías protestante, católica y otras. La información 
podría exhibirse en tres tablas bidireccionales diferentes, 
una correspondiente a cada categoría del tercer factor. Con 
Pijk ~ P(categoría política i , categoría de marihuana j y ca¬ 
tegoría religiosa k), la hipótesis nula de independencia de 
los tres factores expresa que p¡- k = p¡..p.j.p.. k . Denote con n ¡jk 
la frecuencia observada en celda (i, j, k). Demuestre la for¬ 
ma de estimar las cantidades esperadas de celda suponien¬ 
do que H 0 es verdadera (é¡j k = np ijk , de modo que las p ijk 
deban determinarse). A continuación utilice la regla empírica 
para determinar el número de grados de libertad para el es¬ 
tadístico ji cuadrada. 

35. Suponga que en un estado particular formado por cuatro re¬ 
giones distintas, una muestra aleatoria de n k votantes se 
obtiene de la fc-ésima región para k = 1, 2, 3, 4. Cada 
votante se clasifica entonces según cuál candidato (1, 2 o 3) 
prefiere y según el registro del votante (1 = demócrata, 2 = re¬ 
publicano, 3 = independiente). Denote con p¡j k la propor¬ 
ción de votantes de la región k que pertenecen a la categoría 
de candidato i y a la categoría de registro j. La hipótesis nu¬ 
la de regiones homogéneas es H 0 : p-j = p- 2 = p- 3 = p- 4 pa¬ 
ra toda i, j (es decir, la proporción dentro de la cual cada 
combinación de candidato/registro es igual para las cuatro 
regiones). Suponiendo que H 0 es verdadera, determine p ¡jk y 
e¡j k como funciones de las n ijk observadas, y use la regla em¬ 
pírica para obtener el número de grados de libertad para la 
prueba ji cuadrada. 
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36. Considere la siguiente tabla de 2 X 3 que presenta las pro¬ 
porciones simples que cayeron en las diversas combinacio¬ 
nes de categorías (por ejemplo, 13% de las de la muestra 
estuvieron en la primera categoría de ambos factores). 

12 3 


0.13 

0.19 

0.28 

0.07 

0.11 

0.22 


Ejercicios suplementarios 595 

a. Suponga que la muestra estuvo formada de n = 100 per¬ 
sonas. Utilice la prueba ji cuadrada para independencia 
con nivel de significación de 0.10. 

b. Repita el inciso a suponiendo que el tamaño muestral 
fue de n = 1000. 

c. ¿Cuál es el tamaño muestral n más pequeño para el que 
estas proporciones observadas darían por resultado el re¬ 
chazo de la hipótesis de independencia? 


EJERCICIOS SUPLEMENTARIOS (37-49) 


37. El artículo “Birth Order and Political Success” ( Psych. Re- 
ports, 1971: 1239-1242) publica que entre 31 candidatos de 
elección popular seleccionados al azar, que provenían de fa¬ 
milias con cuatro hijos, 12 eran primogénitos, 11 fueron in¬ 
termedios y 8 fueron últimos. Utilice esta información para 
probar la hipótesis nula de que es igualmente probable que 
un candidato político, proveniente de una de estas familias, 
esté en cualquiera de las cuatro posiciones ordinales. 

38. Los resultados de un experimento para evaluar el efecto del 
petróleo crudo en parásitos de peces se describen en el artí¬ 
culo “Effects of Crude Oils on the Gastrointestinal Parasites 
ofTwo Species of Marine Fish” (J. Wildlife Diseases, 1983: 
253-258). Se compararon tres tratamientos (corres¬ 
pondientes a poblaciones del procedimiento descrito): 
1) sin contaminación, 2) contaminación por petróleo de 1 
año de antigüedad, y 3) contaminación por petróleo nuevo. 
Para cada condición de tratamiento se tomó una muestra de 
peces, y cada uno de éstos se clasificó como con parásitos 
o sin parásitos. Se da información compatible con la del 
artículo. ¿La información indica que los tres tratamientos 
difieren con respecto a la verdadera proporción de peces 
con parásitos o sin parásitos? Pruebe usando a = 0.01. 


Tratamiento 

Con par sitos 

Sin parásitos 

Control 

30 

3 

Petróleo viejo 

16 

8 

Petróleo nuevo 

16 

16 


39. Las aptitudes de entrenadores en atletismo en jefe, y ayu¬ 
dantes en atletismo, hombres y mujeres, se compararon en 
el artículo “Sex Bias and the Validity of Believed Differen- 
ces Between Male and Female Interscholastic Athletic Coa- 
ches” (Research Quarterly for Exercise and Sport, 1990: 
259-267). Cada una de las personas de muestras aleatorias 
de 2225 entrenadores, y 1141 entrenadoras, se clasificó se¬ 
gún el número de años de experiencia como entrenador pa¬ 
ra obtener la siguiente tabla bidireccional. ¿Hay suficiente 
evidencia para concluir que las proporciones que caen en 
las categorías de experiencia son diferentes para hombres y 
mujeres? Use a = 0.01. 


Años de experiencia 


Género 

1-3 

4-6 

7-9 

10-12 

13 + 

Masculino 

202 

369 

482 

361 

811 

Femenino 

230 

251 

238 

164 

258 


40. Los autores del artículo “Predicting Professional Sports Ca¬ 
rne Outcomes frorn Intermedíate Game Scores” ( Chance, 
1992: 18-22) usaron una prueba ji cuadrada, para determi¬ 
nar si había algún mérito en la idea de que los juegos de 
baloncesto no se deciden hasta el último cuarto, mientras 
que los juegos de béisbol acaban hacia la séptima entrada. 
También consideraron fútbol americano y jockey. Se recolec¬ 
tó información de 189 juegos de baloncesto, 92 juegos de 
béisbol, 80 juegos de jockey y 93 juegos de fútbol. Los jue¬ 
gos analizados se muestrearon al azar de todos los encuen 
tros realizados durante la temporada de 1990 para béisbol y 
fútbol, y para la temporada de 1990-1991 de baloncesto 
y jockey. Para cada juego, se determinó el líder de final de 
juego y luego se observó si en realidad terminó ganando el 
partido. La información resultante se resume en la tabla 
siguiente. 


Deporte 

Gana líder 
de final de juego 

Pierde líder 
de final de juego 

Baloncesto 

150 

39 

Béisbol 

86 

6 

Hockey 

65 

15 

Fútbol 

72 

21 


Los autores expresan que “líder de final de juego se define 
como el equipo que va adelante después del tercer cuarto en 
baloncesto y fútbol, dos tiempos en jockey y siete entradas 
en béisbol. El valor de ji cuadrada con tres grados de liber¬ 
tad es 10.52 (P < 0.015)”. 

a. Exprese las hipótesis relevantes y llegue a una conclu¬ 
sión usando a = 0.05. 

b. ¿Piensa el lector que su conclusión en el inciso a puede 
atribuirse a que un solo deporte es una anomalía? 
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41. La siguiente tabla bidireccional de frecuencias aparece en el 
artículo “Marijuana Use in College” ( Youth and Society , 
1979: 323-334). Cada uno de los 445 estudiantes universi¬ 
tarios fue clasificado según su frecuencia de consumo de 
marihuana y si los padres consumían alcohol y drogas si- 
coactivas. ¿La información sugiere que la adicción de pa¬ 
dres y de estudiantes son independientes en la población de 
la que se extrajo la muestra? Utilice el método del valor P 
para llegar a una conclusión. 

Nivel estándar de 
consumo de marihuana 




Nunca 

Ocasional 

Regular 

Padres 

Ninguno 

141 

54 

40 

consumen 

alcohol 

Uno 

68 

44 

51 

y drogas 

Ambos 

17 

11 

19 


42. En un estudio de 2989 muertes por cáncer, se registraron la 
ubicación del deceso (casa, hospital de urgencias, hospital 
de enfermedades crónicas) y la edad al fallecimiento; el re¬ 
sultado fue la siguiente tabla bidireccional de frecuencias 
(“Where Cáncer Patients Die”, Public Health Reports, 
1983: 173). Con el uso de un nivel de significación de 0.01, 
pruebe la hipótesis nula de que la edad al fallecimiento y el 
lugar son independientes. 

Lugar 




Hospital de 

Hospital 


Casa 

urgencias 

enf. crónicas 

15-54 

94 

418 

23 

... , 55-64 

Edad 65-74 

116 

524 

34 

156 

581 

109 

Más de 74 

138 

558 

238 


43. En un estudio para investigar el límite al que las personas 
perciben olores industriales en cierta región (“Annoyance 
and Health Reactions to Odor from Refineries and Other In¬ 
dustries in Carson, California”, Environmental Research, 
1978: 119-132), se obtuvo una muestra de individuos de ca¬ 
da una de las tres regiones cercanas a instalaciones indus¬ 
triales. A cada uno se le preguntó si percibía olores 1) todos 
los días, 2) al menos una vez a la semana, 3) al menos una 
vez al mes, 4) menos de una vez al mes, o 5) nada en abso¬ 
luto; el resultado es la información de la salida SPSS de la 
parte inferior de esta página. Exprese y pruebe las hipótesis 
apropiadas. 

44. Numerosos compradores han expresado su descontento 
porque las tiendas de abarrotes han dejado de poner precios 
en artículos individuales de la tienda. El artículo “The Im- 
pact of Item Price Removal on Grocery Shopping Beha- 
vior” (7. Marketing , 1980: 73-93) publica un estudio en el 
que cada comprador de una muestra se clasificó por edad y 
por si sentía la necesidad que se pusieran precios. Con base 
en la información siguiente, ¿la necesidad de que se pusie¬ 
ran precios en artículos es independiente de la edad? 


Edad 



<30 

30-39 

40-49 

50-59 

>60 

Número en 

muestra 

150 

141 

82 

63 

49 

Número que 
desea que se 

127 

118 

77 

61 

41 


pongan precios 


45. Denote con pj la proporción de éxitos en una población 
particular. El valor del estadístico de prueba del capítulo 8 


Crosstabulation: AREA By CATEGORY 


CATEGORY -► 

AREA 


Chi-Square 
70.64156 


Count 
Exp Val 


Row Pct 

Col Pct 

1.00 

2.00 

3.00 

4.00 

5.00 

Row 

Total 

1.00 

20 

28 

23 

14 

12 

97 


12.7 

24.7 

18.0 

16.0 

25.7 

33.3% 


20.6% 

28.9% 

23.7% 

14.4% 

12.4% 



52.6% 

37.8% 

42.6% 

29.2% 

15.6% 


2.00 

14 

34 

21 

14 

12 

95 


12.4 

24.2 

17.6 

15.7 

25.1 

32.6% 


14.7% 

35.8% 

22.1% 

14.7% 

12.6% 



36.8% 

45.9% 

38.9% 

29.2% 

15.6% 


3.00 

4 

12 

10 

20 

53 

99 


12.9 

25.2 

18.4 

16.3 

26.2 

34.0% 


4.0% 

12.1% 

10.1% 

20.2% 

53.5% 



10.5% 

16.2% 

18.5% 

41.7% 

68.8% 


Column 

38 

74 

54 

48 

77 

291 

Total 

13.1% 

25.4% 

18.6% 

16.5% 

26.5% 

100.0% 

D. F. 

Significance Min E.F. 

Celia 

with E. 

F. < 5 

8 

. 0000 

12.405 

None 
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para probar H 0 : p l = p l0 fue z = {Pi ~ p 10 )/V PwPio^ don- 
de p 2Q = 1 - p l0 . Demuestre que para el caso k = 2, el va¬ 
lor del estadístico de prueba ji cuadrada de la sección 14.1 
satisface x 1 ~ z 2 - [Sugerencia: Primero demuestre que 
(«i “ "Pío) 2 = («2 “ rap 2 o) 2 -] 

46. El torneo de baloncesto de la NCAA empieza con 64 equi¬ 
pos que se reparten en cuatro torneos regionales, cada uno 
con 16 equipos. Los 16 equipos de cada región se clasifican 
entonces (sembrados) de 1 a 16. Durante el periodo de 12 
años de 1991 a 2002, el equipo clasificado en primer lugar 
ganó 22 veces su torneo regional, el equipo clasificado en 
segundo lugar ganó 10 veces, el equipo clasificado en ter¬ 
cer lugar ganó 5 veces, y los 11 torneos regionales restantes 
fueron ganados por equipos clasificados más abajo del ter¬ 
cer lugar. Denote con Py la probabilidad de que el equipo 
clasificado i en su región es ganador en su juego contra el 
equipo clasificado j. Una vez disponibles las Py, es posible 
calcular la probabilidad de que cualquier sembrado particu¬ 
lar gane su torneo regional (un cálculo complicado porque 
el número de resultados del espacio muestral es muy gran¬ 
de). El artículo “Probability Models for the NCAA Regional 
Basketball Tournaments” {The American Statistician, 1991: 
35-38) propuso diversos modelos diferentes para las Py. 

a. Un modelo postuló Py = 0.5 — A(¿ — j) con A = 1/32 
(de donde P 16 j = A, P l62 — 2A, etc.). Con base en esto, 
/•(sembrado #1 gana) = 0.27477, /'(sembrado #2 gana) 
= 0.20834 y /^sembrado #3 gana) = 0.15429. ¿Este 
modelo parece dar un buen ajuste a la información? 

b. Un modelo más refinado tiene probabilidades de juego 
Py = 0.5 + 0.2813625 (z¡ ~ Zj), donde las z son medidas 
de resistencias relativas a percentiles normales estánda¬ 
res (los percentiles para equipos sembrados ganadores 
están más cerca entre sí que los equipos sembrados más 
abajo, y 0.2813625 asegura que el rango de probabilida¬ 
des es igual para el modelo del inciso a). Las probabili¬ 
dades resultantes de que los sembrados 1, 2 ó 3 ganen 
sus torneos regionales son 0.45883, 0.18813 y 0.11032, 
respectivamente. Evalúe el ajuste de este modelo. 

47. ¿Se ha preguntado alguna vez si los jugadores de fútbol soc- 
cer sufren de efectos negativos cuando “cabecean” el ba¬ 
lón? Los autores del artículo “No Evidence of Impaired 
Neurocognitive Performance in Collegiate Soccer Players” 
{The Ame r. J. of Sports Medicine, 2002: 157-162) investiga¬ 
ron este problema desde varias perspectivas. 

a. El artículo informó que 45 de los 91 jugadores de fútbol 
soccer de su muestra sufrieron al menos una contusión, 
28 de los 96 atletas no futbolistas habrían sufrido al me¬ 
nos una contusión, y sólo 8 de 53 controles de estudian¬ 
tes habían sufrido al menos una contusión. Analice esta 
información y saque conclusiones apropiadas. 

b. Para los futbolistas, el coeficiente de correlación mues¬ 
tral de los valores de x = exposición al fútbol (número 
total de temporadas de competencia jugadas antes de 
inscribirse en el estudio) y y = calificación en un exa¬ 
men de recordatorio de memoria, fue r = —0.220. Inter¬ 
prete este resultado. 


c. A continuación se encuentra un resumen de información 
sobre calificaciones de un examen oral controlado de 
asociación de palabras para atletas futbolistas y no fut¬ 
bolistas: 

«i = 26, x t = 37.50, i, = 9.13, n 2 = 56, 

T 2 = 39.63, s 2 = 10.19 

Analice esta información y saque conclusiones apropiadas. 

d. Considerando el número de concusiones previas en ju¬ 
gadores no futbolistas, los valores de la media ± desvia¬ 
ción estándar para los tres grupos fueron 0.30 ± 0.67, 
0.49 ± 0.87 y 0.19 ± 0.48. Analice esta información y 
saque conclusiones apropiadas. 

48. ¿Los dígitos sucesivos de la expansión decimal de t t se 
comportan como si fueran seleccionados de una tabla de 
números aleatorios (o de un generador de números aleato¬ 
rios de una computadora)? 

a. Denote por p 0 la proporción a largo plazo de dígitos de 
la expansión que sean iguales a 0, y defina p¡, . . . , p 9 
análogamente. ¿Qué hipótesis acerca de estas proporcio¬ 
nes deben probarse, y cuál es el grado de libertad para la 
prueba ji cuadrada? 

b. H 0 del inciso a no sería rechazada para la sucesión no 
aleatoria 012. . . 901. .. 901.. . Considere grupos de dos 
dígitos que no se traslapen, y denote por p¡j la propor¬ 
ción a largo plazo de grupos para los cuales el primer dí¬ 
gito es i y el segundo dígito es j. ¿Qué hipótesis acerca 
de estas proporciones deben probarse, y cuál es el gra¬ 
do de libertad para la prueba ji cuadrada? 

c. Considere grupos de 5 dígitos que no se traslapan. ¿Po¬ 
dría una prueba ji cuadrada de hipótesis apropiadas acer¬ 
ca de las Py Um estar basada en los primeros 100 000 
dígitos? Explique. 

d. El artículo “Are the Digits of ir an Independent and 
Identically Distributed Sequence?” {The American Sta¬ 
tistician, 2000: 12-16) consideró los primeros 1 254 540 
dígitos de t r, y publicó los siguientes valores P para ta¬ 
maños grupales de 1,. .., 5: 0.572, 0.078, 0.529, 0.691, 
0.298. ¿Qué concluiría el lector? 

49. En una muestra de 91 jugadores de fútbol soccer colegial, 
el número medio de contusiones fue de 1.07, y la desvia¬ 
ción estándar fue de 1.83 (“No Evidence of Impaired Neu¬ 
rocognitive Performance in Collegiate Soccer Players”, The 
Amer. J. of Sports Med., 2002: 157-162). También se reco¬ 
lectó información para una muestra de 96 atletas no futbo¬ 
listas y una muestra de controles de estudiantes y dio como 
resultado la información siguiente: 



Soccer 

Atletas no de soccer 

Controles 

Contusión 

45 

28 

8 

Sin contusión 

46 

68 

45 

Prueba Weschler 

de espacio entre dígitos 


Grupo 

n 

X 

í 

Soccer 

86 

8.20 

2.05 

No de soccer 

95 

8.11 

2.21 

Controles 

53 

7.60 

2.29 


a. ¿Es factible que el número de contusiones entre jugadores 
de fútbol soccer colegial tenga una distribución aproxima¬ 
damente normal? 
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b. Estime el promedio verdadero del número de contusio¬ 
nes entre jugadores de fútbol soccer colegiales, de modo 
que exprese información acerca de la precisión y confia¬ 
bilidad, e interprete la estimación. 

c. ¿Le parece que las verdaderas proporciones de indivi¬ 
duos que habían tenido una contusión no son idénticas 
para las tres categorías? Use un procedimiento inferen¬ 
cia! apropiado. 


Bibliografía 

Agresti, Alan, An Introduction to CategóricaI Data Analysis, Wi- 
ley, Nueva York, 1996. Un excelente examen de diversos as¬ 
pectos de análisis de datos categóricos por uno de los más 
prominentes investigadores en este campo. 

Everitt, B. S., The Analysis of Contingency Tables (2a. edición), 
Halsted Press, Nueva York, 1992. Un estudio compacto pero 


categóricos 

d. ¿Le parece que el verdadero promedio de calificaciones 
en la prueba de espacio entre dígitos no es igual para los 
tres tipos de individuos? Use un procedimiento inferen- 
cial apropiado. [Nota: El artículo citado también dio in¬ 
formación breve acerca de los resultados de otras 
pruebas neurosicológicas; el título del artículo habla de 
este caso.] 


informativo de métodos para analizar datos categóricos, ex¬ 
puesto con un mínimo de matemáticas. 

Mosteller Frederick y Richard Rourke, Sturdy Statistics, Addi- 
son-Wesley, Reading, MA, 1973. Contiene diversos capítulos 
fáciles de leer sobre los variados usos de la ji cuadrada. 
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Procedimientos 
libres de distribución 


INTRODUCCION 

Cuando la población o poblaciones fundamentales no son normales, las pruebas f y 
F y los intervalos de confianza f de los capítulos 7-13, tendrán en general niveles de 
significación reales o niveles de confianza que difieren de los niveles nominales (los 
prescritos por el experimentador mediante la selección, por ejemplo, de f 0 025 , F 001 , 
etc.) a y 100(1 - a)%\ aun cuando la diferencia entre niveles reales y nominales puede 
no ser grande cuando la desviación de la normalidad no sea demasiado grande. Debi¬ 
do a que los procedimientos f y F requieren la suposición de distribución de norma¬ 
lidad, no son procedimientos "libres de distribución", alternativamente, porque están 
basados en una familia paramétrica particular de distribuciones (normal), no son pro¬ 
cedimientos "no paramétricos". 

En este capítulo se describen procedimientos que son válidos [nivel real a o ni¬ 
vel de confianza 100(1 - a)%] simultáneamente para muchos tipos diferentes de 
distribuciones fundamentales. Estos procedimientos se denominan libres de distri¬ 
bución o no paramétricos. En la sección 15.1 se estudia un procedimiento de prueba 
para analizar una sola muestra de Información; la sección 15.2 presenta un procedimiento 
de prueba para usar en problemas de dos muestras. En la sección 15.3 se analizan 
Intervalos de confianza sin distribución para /i y ju,, - /¿ 2 . La sección 15.4 describe 
procedimientos ANOVA sin distribución. Todos estos procedimientos son competido¬ 
res de los procedimientos paramétricos (t y F), descritos en capítulos anteriores, de 
modo que es importante comparar el funcionamiento de los dos tipos de procedi¬ 
mientos bajo modelos poblacionales normales y no normales. Hablando en términos 
generales, los procedimientos sin distribución funcionan casi igualmente bien como 
sus similares f y Fen el "terreno" de la distribución normal y con frecuencia dan una 
mejora considerable bajo condiciones no normales. 


599 
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600 CAPÍTULO 15 Procedimientos libres de distribución 


15.1 La prueba Wilcoxon de rango con signo 

Un químico investigador realizó un experimento químico particular un total de diez veces 
bajo condiciones idénticas, obteniendo los siguientes valores ordenados de temperatura de 
reacción: 

-0.57 -0.19 -0.05 0.76 1.30 2.02 2.17 2.46 2.68 3.02 

Por supuesto que la distribución de temperatura de reacción es continua. Suponga que el in¬ 
vestigador está dispuesto a suponer que la distribución de temperatura de reacción es simé¬ 
trica; es decir, hay un punto de simetría tal que la curva de densidad a la izquierda de ese 
punto es la imagen espejo de la curva de densidad a la derecha. Este punto de simetría es la 
mediana de la distribución (y también es el valor medio siempre que la media sea finita). 
La suposición de simetría puede parecer al principio bastante aventurada, pero recuerde que 
cualquier distribución normal es simétrica, de modo que la simetría es en realidad una su¬ 
posición más débil que la normalidad. 

Ahora hay que probar la hipótesis nula de que la mediana de la distribución de tem¬ 
peratura de reacción es cero; es decir, H 0 : ¡1 = 0. Esto equivale a decir que una temperatu¬ 
ra de cualquier magnitud particular, por ejemplo 1.50, no es más probable que sea positiva 
(+1.50) de lo que puede ser negativa (—1.50). Una mirada a los datos sugiere que esta hi¬ 
pótesis no es muy sostenible; por ejemplo, la mediana muestral es 1.66, que es mucho ma¬ 
yor que la magnitud de cualquiera de las tres observaciones negativas. 

La figura 15.1 presenta dos funciones de densidad de probabilidad, una para la que H 0 
es verdadera y una para la que H ñ es verdadera. Cuando H 0 es verdadera, se espera que las 
magnitudes de las observaciones negativas de la muestra sean comparables a las magnitu¬ 
des de las observaciones positivas. No obstante, si H 0 es “excesivamente” no verdadera co¬ 
mo en la figura 15.1b), entonces las observaciones de magnitud absoluta grande tenderán a 
ser positivas en lugar de negativas. 



0 0 fí 

a) b) 

Figura 15.1 Distribuciones para las que a) ¡1 = 0; b) ¡1 8> 0. 


Para la muestra de diez temperaturas de reacción, por ahora no hay que hacer caso de 
los signos de observaciones y ordene las magnitudes absolutas de 1 a 10, con la mínima 
de 1, la segunda más pequeña de 2 y así sucesivamente. A continuación aplique el signo de 
cada observación al rango correspondiente (de modo que algunos rangos con signo serán 
negativos, por ejemplo —3, mientras que otros serán positivos, por ejemplo 8). El estadísti¬ 
co de prueba será S + = la suma de los rangos con signo positivo. 


Magnitud 

absoluta 

0.05 

0.19 

0.57 

0.76 

1.30 

2.02 

2.17 

2.46 

2.68 

3.02 

Rango 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

Rango 
con signo 

-1 

-2 

-3 

4 

5 

6 

7 

8 

9 

10 


s + = 4 + 5 + 6 + 7 + 8 + 9+10 = 49 
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Cuando la mediana de la distribución es mucho mayor a 0, casi todas las observaciones con 
magnitudes absolutas grandes deberían ser positivas, resultando en rangos de signo positi¬ 
vo y un valor grande de .v + . Por otra parte, si la mediana es 0, las magnitudes de observacio¬ 
nes con signo positivo deberían estar mezcladas con las observaciones de signo negativo, en 
cuyo caso s + no será muy grande. Así, se debería rechazar H 0 : ¡1=0 cuando ,v + es “muy 
grande” y la región de rechazo debería tener la forma s + > c. 

El valor crítico c debería escogerse de modo que la prueba tenga un nivel deseado de 
significación (probabilidad de error tipo I) por ejemplo 0.05 o 0.01. Para esto es necesario 
hallar la distribución del estadístico de prueba S + cuando la hipótesis nula sea verdadera. 
Considérese n = 5, en cuyo caso hay 2 5 = 32 formas de aplicar signos a los cinco rangos 
1, 2, 3, 4 y 5 (cada rango podría tener un signo — o un signo +). El punto clave es que cuan¬ 
do H 0 es verdadera, cualquier conjunto de cinco rangos con signo tiene la misma probabili¬ 
dad que cualquier otro conjunto. Esto es, la observación más pequeña en magnitud absoluta 
es igualmente probable que sea positiva o negativa y lo mismo es cierto para la segunda ob¬ 
servación más pequeña en magnitud absoluta, y así sucesivamente. Entonces el conjunto 
— 1, 2, 3, —4, 5 de rangos con signo es tan probable como el conjunto 1, 2, 3, 4, —5 y tan 
probable como cualquiera de las otras 30 posibilidades. 

La tabla 15.1 es una lista de 32 posibles secuencias de rango con signo cuando n = 5 
junto con el valor s + para cada secuencia. Esto inmediatamente da la “distribución nula” 
de S_ que se ve en la tabla 15.2. Por ejemplo, la tabla 15.1 muestra que tres de las 32 se¬ 
cuencias posibles tienen s + = 8, de modo que P(S , = 8 cuando H 0 es verdadera) = 3 ' 2 4- 
= -|r. Nótese que la distribución nula es simétrica alrededor de 7.5 [en forma más 


Tabla 15.1 Posibles secuencias de rango con signo para n = 5 



Secuencia 



s + 


Secuencia 



*+ 

-1 

-2 

-3 

-4 

-5 

0 

-1 

-2 

-3 

+4 

-5 

4 

+ 1 

-2 

-3 

-4 

-5 

1 

+ 1 

-2 

-3 

+4 

-5 

5 

-1 

+ 2 

-3 

-4 

-5 

2 

-1 

+ 2 

-3 

+4 

-5 

6 

-1 

-2 

+3 

-4 

-5 

3 

-1 

-2 

+3 

+4 

-5 

7 

+ 1 

+ 2 

-3 

-4 

-5 

3 

+ 1 

+ 2 

-3 

+4 

-5 

7 

+ 1 

-2 

+3 

-4 

-5 

4 

+ 1 

-2 

+3 

+4 

-5 

8 

-1 

+ 2 

+3 

-4 

-5 

5 

-1 

+ 2 

+3 

+4 

-5 

9 

+ 1 

+ 2 

+3 

-4 

-5 

6 

+ 1 

+2 

+3 

+4 

-5 

10 

-1 

-2 

-3 

-4 

+5 

5 

-1 

-2 

-3 

+4 

+5 

9 

+ 1 

-2 

-3 

-4 

+5 

6 

+ 1 

-2 

-3 

+4 

+5 

10 

-1 

+ 2 

-3 

-4 

+5 

7 

-1 

+2 

-3 

+4 

+5 

11 

-1 

-2 

+3 

-4 

+5 

8 

-1 

-2 

+3 

+4 

+5 

12 

+ 1 

+ 2 

-3 

-4 

+5 

8 

+ 1 

+2 

-3 

+4 

+5 

12 

+ 1 

-2 

+3 

-4 

+5 

9 

+ 1 

-2 

+3 

+4 

+5 

13 

-1 

+ 2 

+3 

-4 

+5 

10 

-1 

+2 

+3 

+4 

+5 

14 

+ 1 

+ 2 

+3 

-4 

+5 

11 

+ 1 

+2 

+3 

+4 

+5 

15 


Tabla 15.2 Distribución nula de 5 + cuando n = 5 


s + 

0 

i 

2 

3 

4 

5 

6 

7 

P(s +) 

1 

1 

1 

2 

2 

3 

3 

3 

32 

32 

32 

32 

32 

32 

32 

32 

s + 

8 

9 

10 

n 

12 

13 

14 

15 

p(s +) 

3 

3 

3 

2 

2 

1 

1 

1 

32 

32 

32 

32 

32 

32 

32 

32 
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general, simétricamente distribuida sobre los posibles valores 0, 1,2,, n(n + 1 )/2]. Es¬ 
ta simetría es importante para relacionar la región de rechazo de pruebas de cola inferior y 
de dos colas con la prueba de cola superior. 

Para n = 10 hay 2 10 = 1024 posibles secuencias de rango con signo, de modo que ela¬ 
borar una lista sería objeto de un gran esfuerzo. Cada secuencia, no obstante, tendría una 
probabilidad -ppj cuando H 0 es verdadera, de la que la distribución de S , cuando H 0 es ver¬ 
dadera se puede obtener fácilmente. 

Ahora se puede determinar una región de rechazo para probar H 0 : jl = 0 en función 
de H a : jl > 0 que tiene un nivel de significación a adecuadamente pequeño. Considere la 
región de rechazo R = {s + : s + > 13) = {13, 14, 15}. Entonces 

a = Pf rechazar H 0 cuando es verdadera) 

= P(S_ = 13, 14 o 15 cuando H 0 es verdadera) 

32 ~ 32 ' 32 32 

= 0.094 

de modo que R = ¡13, 14, 15} especifica una prueba con nivel aproximado de 0.1. Para la 
región de rechazo {14, 15}, a = 2/32 = 0.063. Para la muestra x ] = 0.58, x 2 = 2.50, 
x 3 = —0.21, x 4 = 1.23, x 5 = 0.97, la secuencia de rango con signo es — 1, +2, +3, +4, +5, 
de modo que s + = 14 y al nivel 0.063 H 0 sería rechazada. 

Descripción general de la prueba Wilcoxon 
de rango con signo 

Debido a que se supone que la distribución fundamental es simétrica, p = p, de modo que 
las hipótesis de interés se expresarán en términos de p más que de p.* 


SUPOSICIÓN 


X v X 2 , . . . , X n es una muestra aleatoria de una distribución de probabilidad continua 
y simétrica con media (y mediana) ¡jl. 



Cuando el valor teorizado de p es p 0 , las diferencias absolutas | x¡ — p 0 |, . . . , | x n — p 0 
deben ordenarse de menor a mayor. 


Hipótesis nula: H 0 : ¡i = ¡jl u 


Valor de estadístico de prueba: s + = suma de los rangos asociados con las (x¡ — p 0 ) 

Hipótesis alternativa Región de rechazo para prueba de nivel a 


H ñ : p > p 0 
H d : p < p 0 
H d : p A p 0 


s + < c 2 [donde c 2 = n(n + l)/2 — cj 
ya sea s + > c o s + £ n(n + l)/2 — c 


donde los valores críticos Cj y c obtenidos de la tabla A. 13 del apéndice satisfacen 
P(S + > C|) ~ a y P(S. > c) ~ a/2 cuando H 0 es verdadera. 


Si las colas de la distribución son “demasiado gruesas”, como fue el caso con la distribución de Cauchy men¬ 
cionada en el capítulo 6, entonces ¡jl no existirá. En tales casos, la prueba Wilcoxon todavía será válida para prue¬ 
bas referentes a jl. 
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Ejemplo 15.1 Un fabricante de planchas eléctricas, deseando probar la precisión del termostato en la po¬ 
sición de ajuste de 500°F, da instrucciones a una ingeniera de pruebas para obtener tempe¬ 
raturas reales en esa posición de ajuste para 15 planchas que usan termopar. Las mediciones 
resultantes son como sigue: 

494.6 510.8 487.5 493.2 502.6 485.0 495.9 498.2 

501.6 497.3 492.0 504.3 499.2 493.5 505.8 

La ingeniera piensa que es razonable suponer que una desviación de temperatura de cual¬ 
quier magnitud, desde los 500°, es tan probable que sea positiva como negativa (la suposi¬ 
ción de simetría), pero desea protegerse contra una posible situación fuera de normalidad de 
la distribución real de temperatura, de modo que decide usar la prueba Wilcoxon de rango 
con signo para ver si la información da una fuerte sugerencia de calibración incorrecta de la 
plancha. 

Las hipótesis son: H 0 : ¡jl = 500 en función de H. '. ¡jl =t= 500, donde ¡± = promedio verda¬ 
dero de temperatura real en la posición de ajuste de 500°F. Restando 500 de cada x¡ se tiene 

-5.6 10.8 -12.5 -6.8 2.6 -15.0 -4.1 -1.8 1.6 -2.7 

-8.0 4.3 -0.8 -6.5 5.8 

Los rangos se obtienen al ordenar éstos de menor a mayor cualquiera que sea su signo. 



Magnitud 

absoluta 

0.8 1.6 

1.8 

2.6 

2.7 

4.1 

4.3 

5.6 

5.8 

6.5 

6.8 

8.0 

10.8 

12.5 

15.0 

Rango 

1 2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

Signo 

- + 

- 

+ 

- 

- 

+ 

- 

+ 

- 

- 

- 

+ 

- 

- 



Así, s + = 2 + 4 + 7 + 9+ 13 = 35. De la tabla A. 13 del apéndice, P(S + > 95) = 
P(S + s 25) = 0.024 cuando H 0 es verdadera, de modo que la prueba de dos colas con nivel 
aproximado de 0.05 rechaza H 0 cuando s + > 95 o < 25 [la a exacta es 2(0.024) = 0.048], 
Como s + = 35 no está en la región de rechazo, no se puede concluir al nivel 0.05 que /i sea 
algo diferente a 500. Incluso al nivel 0.094 (aproximadamente 0.1), H 0 no es rechazada, 
porque P(S + s 30) = 0.047 implica que valores entre 30 y 90 no son importantes a ese 
nivel. El valor P de los datos es entonces mayor a 0.1. ■ 

Aun cuando una implicación teórica de la continuidad de la distribución fundamental 
es que no ocurrirán empates, es frecuente que en la práctica sí ocurran debido a lo discreto 
de los instrumentos de medida. Si hay diversos valores de información con la misma mag¬ 
nitud absoluta, entonces se les asignaría el promedio de los rangos que recibirían si fueron 
ligeramente muy distintos entre sí. Por ejemplo, si en el ejemplo 15.1 x 8 = 498.2 se cambia 
a 498.4, entonces dos valores diferentes de (x¡ — 500) tendrían magnitud absoluta de 1.6. Los 
rangos a ser promediados serían 2 y 3, por lo que a cada uno se le asignaría rango 2.5. 

Observaciones apareadas 

Cuando los datos consistieron en (Aj, bj), . . . , (X n Yj y las diferencias D 1 = X 1 — F¡, . . ., 
D n = X n — Y n estuvieron normalmente distribuidas, en el capítulo 9 se usó una prueba t apa¬ 
reada para probar hipótesis acerca de la diferencia esperada ¡x D . Si no se supone normali¬ 
dad, las hipótesis acerca de ¡jl d se pueden probar usando la prueba Wilcoxon de rango con 
signo en las D¡ siempre que la distribución de las diferencias sea continua y simétrica. Si X¡ 
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y Y¡ tienen distribuciones continuas que difieren sólo con respecto a sus medias (de modo 
que la distribución Y es la distribución X desplazada por — p 2 = pi D ), entonces D¡ ten¬ 
drá una distribución simétrica continua (no es necesario para que las distribuciones X y Y 
sean simétricas individualmente). La hipótesis nula es H 0 : p D = A 0 y el estadístico de prue¬ 
ba S + es la suma de los rangos asociados con las iD t — A 0 ) positivas. 

Ejemplo 15.2 Un experimento para comparar la capacidad de dos disolventes diferentes para extraer creo¬ 
sota impregnada en troncos de prueba comprendía el uso de ocho troncos distintos. Después 
de cortar el tronco en dos segmentos, uno de éstos se seleccionaba al azar para aplicarle el 
primer disolvente, con el segundo disolvente aplicado en el otro segmento, y se obtuvieron 
los siguientes datos: 


Tronco 

1 

2 

3 

Disolvente 1 

3.92 

3.79 

3.70 

Disolvente 2 

4.25 

4.20 

4.41 

Diferencia 

-0.33 

-0.41 

-0.71 

Rango con signo 

-4 

-5 

-8 


4 

5 

6 

7 

8 

4.08 

3.87 

3.95 

3.55 

3.76 

3.89 

4.39 

3.75 

4.20 

3.90 

0.19 

-0.52 

0.20 

-0.65 

-0.14 

2 

-6 

3 

-7 

-1 


El primer disolvente se usa actualmente y el segundo es una nueva fórmula diseñada para 
producir una mejor capacidad de extracción. ¿Esta información sugiere que la verdade¬ 
ra cantidad promedio extraída por el segundo disolvente es mayor que la del primer disol¬ 
vente? Las hipótesis relevantes son H 0 : p D = 0 en función de // a : p, D < 0. La tabla A. 13 del 
apéndice indica que para una prueba con nivel de significación aproximado de 0.05, la hi¬ 
pótesis nula debe ser rechazada si s + < (8)(9)/2 — 30 = 6. El valor del estadístico de prue¬ 
ba es 2 + 3 = 5, que cae en la región de rechazo. Por tanto, se rechaza H 0 al nivel de 
significación 0.05 a favor de la conclusión de que el nuevo disolvente sobrepasa el rendimien¬ 
to del que se usa actualmente. La salida MIN1TAB que aparece enseguida da el valor del 
estadístico de prueba y también el valor P correspondiente, que es P(S . < 5 cuando H 0 es 
verdadera). 


Test of median = 0.000000 versus median< 0.000000 


N for 
N Test 

diff 8 8 


Wilcoxon 

Statistic 

5.0 


P 

0.040 


Estimated 

Median 

-0.3025 


Una aproximación a muestra grande 

La tabla A. 13 del apéndice da valores críticos para pruebas a sólo cuando n < 20. Para n > 20, 
se puede demostrar que S + tiene aproximadamente una distribución normal con 

_ n(n +1) 2 — n ( n 1)(2« + 1) 

^ s + 4 °" 5 + 24 

cuando H 0 es verdadera. 

La media y varianza resultan de observar que cuando H 0 es verdadera (la distribución 
simétrica está centrada en /t 0 ), entonces es igualmente probable que el rango i reciba un sig¬ 
no + que un signo —. Así, 


S + = W, + W 2 + W 3 + • • • + W n 
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Ejemplo 15.3 



15.1 La prueba Wilcoxon de rango con signo 605 


donde 


Wr = 


1 

0 


con probabilidad 0.5 
con probabilidad 0.5 


W = 


con probabilidad 0.5 
con probabilidad 0.5 


(W¡ = 0 es equivalente a que el rango i sea asociado con un —, de modo que i no contribu¬ 
ye a S + .) 

S + es entonces una suma de variables aleatorias y cuando //„ es verdadera, se puede 
demostrar que estas W¡ son independientes. La aplicación de las reglas de valor esperado y 
varianza da la media y varianza de S + . Como las W¡ no están distribuidas de manera idénti¬ 
ca, nuestra versión del teorema de límite central no se puede aplicar, pero hay una versión 
más general del teorema que se puede usar para justificar la conclusión de normalidad. 

El estadístico de prueba de muestra grande está dado ahora por 


S + — n(n + l)/4 


Z Vn(n + 1 )(2n + 1 )/24 

(15.1) 


Para las tres alternativas estándar, los valores críticos para pruebas de nivel a son los valo¬ 
res normales estándar usuales z a , ~z a y —Z n/2 - 

Un tipo particular de viga de acero se ha diseñado para tener una resistencia a la compre¬ 
sión (lb/pulgada 2 ) de al menos 50 000. Para cada viga de una muestra de 25 vigas, la resis¬ 
tencia a la compresión se determinó y aparece en la tabla 15.3. Suponiendo que la 
resistencia real a la compresión está distribuida simétricamente alrededor del verdadero 
valor promedio, utilice la prueba Wilcoxon para determinar si la verdadera resistencia pro¬ 
medio a la compresión es menor que el valor especificado. Esto es, pruebe H 0 : ¡i = 50 000 
en función de /-/ a : ¡i < 50 000 (a favor de la afirmación de que el promedio de resistencia a 
la compresión es al menos 50 000). 


Tabla 15.3 Datos para el ejemplo 15.3 


x¡ - 50000 

Rango con signo 

x¡ - 50000 

Rango con signo 

X; - 50000 

Rango con signo 

-10 

-1 

-99 

-10 

165 

+ 18 

-27 

-2 

113 

+ 11 

-178 

-19 

36 

+3 

-127 

-12 

-183 

-20 

-55 

-4 

-129 

-13 

-192 

-21 

73 

+5 

136 

+ 14 

-199 

-22 

-77 

-6 

-150 

-15 

-212 

-23 

-81 

-7 

-155 

-16 

-217 

-24 

90 

+8 

-159 

-17 

-229 

-25 

-95 

-9 







La suma de los rangos con signo positivo es 3 + 5 + 8+ 11 + 14 + 18 = 59, n(n + l)/4 
= 162.5 y n(n + l)(2n + l)/24 = 1381.25, de modo que 


_ 59 - 162.5 
~ ~~ V 1381.25 


-2.78 


La prueba de nivel 0.01 de cola inferior rechaza H 0 si z — —2.33. Como —2.78 < —2.33, 
H 0 es rechazada a favor de la conclusión de que el promedio verdadero de resistencia a la 
compresión es menor a 50 000. ■ 
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Cuando hay empates en las magnitudes absolutas, de modo que deban usarse rangos 
promedio, todavía es correcto estandarizar S , al restar n(n + l)/4, pero debe usarse la si¬ 
guiente fórmula corregida para varianza: 

oÍ + = -~n(n + 1)(2 n + 1) - - 1)(t,.)(t,. + 1) (15.2) 

donde t¡ es el número de empates en el i-ésimo conjunto de valores empatados y la suma 
sea mayor que todos los conjuntos de valores empatados. Si, por ejemplo, n = 10 y los ran¬ 
gos con signo son 1, 2, —4, —4, 4, 6, 7, 8.5, 8.5 y 10, entonces hay dos conjuntos empata¬ 
dos con Tj = 3 y t 2 = 2, de modo que la suma es (2)(3)(4) + (1)(2)(3) = 30 y <tj + = 
96.25 — 30/48 = 95.62. El denominador de (15.1) debe ser sustituido por la raíz cuadrada 
de (15.2), aun cuando, como muestra este ejemplo, la corrección suele ser insignificante. 

Eficiencia de la prueba Wilcoxon de rango con signo 

Cuando la distribución fundamental que se muestrea es normal, se puede usar ya sea la prue¬ 
ba t o la prueba de rango con signo para probar una hipótesis acerca de ¡jl. La prueba t es la 
mejor en esta situación porque entre todos los niveles de pruebas a es la que tiene ¡3 mínima. 
Puesto que en general conviene que hay numerosas situaciones experimentales en las que la 
normalidad se puede suponer razonablemente, así como algunas en las que no debería estar, 
hay dos preguntas que deben abordarse en un intento por comparar las dos pruebas: 

1. Cuando la distribución fundamental es normal (el “terreno” de la prueba t), ¿cuánto se 
pierde al usar la prueba de rango con signo? 

2. Cuando la distribución fundamental no es normal, ¿puede lograrse una mejoría impor¬ 
tante al usar la prueba de rango con signo? 

Si la prueba Wilcoxon no se afecta mucho con respecto a la prueba t en el “terreno” de es¬ 
ta última, y funciona considerablemente mejor que la prueba t para un gran número de otras 
distribuciones, entonces habrá una fuerte inclinación para usar la prueba Wilcoxon. 

Por desgracia, no hay respuestas sencillas a estas preguntas. Al reflexionar, no es de 
sorprenderse que la prueba t pueda funcionar mal cuando la distribución fundamental tenga 
“colas gruesas” (es decir, cuando valores observados que se encuentren lejos de /jl sean re¬ 
lativamente más probables de lo que son cuando la distribución es normal). Esto es porque 
el comportamiento de la prueba t depende de la media muestral, que puede ser muy inesta¬ 
ble en presencia de colas gruesas. La dificultad en producir respuestas a las dos preguntas 
es que ¡3 para la prueba Wilcoxon es muy difícil de obtener y estudiar para cualquier distri¬ 
bución fundamental y lo mismo se puede decir para la prueba t cuando la distribución no 
sea normal. Incluso si ¡3 pudiera obtenerse con facilidad, cualquier medida de eficiencia de¬ 
pendería claramente de qué distribución fundamental se postuló. Expertos en estadística han 
propuesto varias medidas diferentes de eficiencia; una que muchos de éstos consideran creí¬ 
ble se denomina eficiencia asintótica relativa (ARE, por sus siglas en inglés). La ARE de 
una prueba con respecto a otra es en esencia la razón limitadora de tamaños muéstrales pa¬ 
ra obtener idénticas probabilidades de error para las dos pruebas. Entonces, si la ARE 
de una prueba con respecto a una segunda es 0.5, entonces cuando los tamaños muéstrales 
son grandes, se requerirá un tamaño muestral el doble de grande de la primera prueba para 
que funcione tan bien como la segunda prueba. Aun cuando la ARE no caracteriza una ope¬ 
ración de prueba para tamaños muéstrales, se puede demostrar que se cumplen los siguien¬ 
tes resultados: 

1. Cuando la distribución fundamental es normal, la ARE de la prueba Wilcoxon con res¬ 
pecto a la prueba t es aproximadamente 0.95. 

2. Para cualquier distribución, la ARE será al menos 0.86 y para muchas distribuciones 
será mucho mayor a 1. 
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15.1 La prueba Wilcoxon de rango con signo 607 

Se pueden resumir estos resultados diciendo que, en problemas de muestras grandes, la prue¬ 
ba Wilcoxon nunca es mucho menos eficiente que la prueba t y puede ser mucho más eficien¬ 
te si la distribución fundamental está lejos de ser normal. Aun cuando el problema está lejos 
de ser resuelto en el caso de tamaños muéstrales obtenidos en casi todos los problemas prác¬ 
ticos, estudios hechos han demostrado que la prueba Wilcoxon funciona razonablemente y 
por ello es una alternativa viable para la prueba t. 


EJERCICIOS Sección 15.1 (1-9) 


1. Reconsidere la situación descrita en el ejercicio 32 de la sec¬ 
ción 8.2 y use la prueba Wilcoxon con a = 0.05 para probar 
las hipótesis relevantes. 

2. Use la prueba Wilcoxon para analizar la información dada en 
el ejemplo 8.9. 

3. La información siguiente es un subconjunto de la publicada 
en el artículo “Synovial Fluid pH, Lactate, Oxygen and Car¬ 
bón Dioxide Partial Pressure in Various Joint Diseases” 
(Arthritis and Rheumatism, 1971: 476-477). Las observacio¬ 
nes son valores pH del fluido sinovial (que lubrica articula¬ 
ciones y tendones) tomado de personas que sufren de artritis. 
Suponiendo que el pH promedio para personas no artríticas 
es de 7.39, pruebe al nivel 0.05 para ver si la información in¬ 
dica una diferencia entre valores del pH para personas artríti¬ 
cas y no artríticas. 

7.02 7.35 7.34 7.17 7.28 7.77 7.09 

7.22 7.45 6.95 7.40 7.10 7.32 7.14 

4. Se seleccionó una muestra aleatoria de 15 mecánicos para au¬ 
tomóviles, certificados para trabajar en cierto tipo de auto y 
se determinó el tiempo (en minutos) necesario para que cada 
uno de ellos diagnosticara un problema particular; la infor¬ 
mación resultante fue la siguiente: 

30.6 30.1 15.6 26.7 27.1 25.4 35.0 30.8 

31.9 53.2 12.5 23.2 8.8 24.9 30.2 

Utilice la prueba Wilcoxon en el nivel de significación 0.10 
para determinar si la información sugiere que el promedio 
verdadero del tiempo de diagnóstico es menor a 30 minutos. 

5. Un método gravimétrico y uno espectrofotométrico están ba¬ 
jo consideración para determinar el contenido de fosfato de 
un material particular. Se obtienen 12 muestras del material, 
cada una se corta a la mitad y se hace la determinación de ca¬ 
da mitad usando uno de los dos métodos; los datos resultan¬ 
tes son los siguientes: 


Muestra 

1 

2 

3 

4 

Gravimétrico 

54.7 

58.5 

66.8 

46.1 

Espectrofotométrico 

55.0 

55.7 

62.9 

45.5 

Muestra 

5 

6 

7 

8 

Gravimétrico 

52.3 

74.3 

92.5 

40.2 

Espectrofotométrico 

51.1 

75.4 

89.6 

38.4 


Muestra 

9 

10 

11 

12 

Gravimétrico 

87.3 

74.8 

63.2 

68.5 

Espectrofotométrico 

86.8 

72.5 

62.3 

66.0 


Use la prueba Wilcoxon para determinar si una técnica da, en 
promedio, un valor diferente al de la otra técnica para este ti¬ 
po de material. 

6. Reconsidere la situación descrita en el ejercicio 41 de la sec¬ 
ción 9.3 y use la prueba Wilcoxon para probar las hipótesis 
apropiadas. 

7. Use la versión de muestra grande de la prueba Wilcoxon en 
el nivel de significación 0.05, en los datos del ejercicio 37 de 
la sección 9.3, para determinar si la diferencia media verda¬ 
dera entre concentraciones interiores y exteriores es mayor 
a 0.20. 

8. Las 25 observaciones siguientes sobre resistencia a fracturas 
de la placa base, de acero de 18% de níquel maraging, se pu¬ 
blicaron en el artículo “Fracture Testing of Weldments”, 
(ASTM Special Publ. No. 381. 1965: 328-356). Suponga que 
una empresa conviene en adquirir este acero para una aplica¬ 
ción particular, sólo si se puede hacer una fuerte demostración 
de evidencia experimental de que la verdadera resistencia 
promedio excede de 75. Suponiendo que la distribución de 
resistencia a fracturas sea simétrica, exprese y pruebe las hi¬ 
pótesis apropiadas al nivel 0.05, y calcule un valor P. 


69.5 

71.9 

72.6 

73.1 

73.3 

73.5 

74.1 

74.2 

75.3 

75.5 

75.7 

75.8 

76.1 

76.2 

76.2 

76.9 

77.0 

77.9 

78.1 

79.6 

79.7 

80.1 

82.2 

83.7 

93.7 




9. Suponga que se hacen observaciones A¡, A,, . . . , X n en un 
proceso, en tiempos 1,2,..., n. Con base en estos datos, se 
desea probar 

H 0 : las X : constituyen una secuencia independiente y distri¬ 
buida de manera idéntica 

en función de 

X í+1 tiende a ser mayor que X¡ para i = l,... ,n (una ten¬ 
dencia creciente) 

Suponga que las X¡ están ordenadas de 1 a n. Entonces, cuan¬ 
do // a es verdadera, los rangos más grandes tienden a presen¬ 
tarse más tarde en la secuencia, en tanto que si H 0 es 
verdadera, los rangos grandes y pequeños tienden a mezclarse. 
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Sea R¡ el rango de X¡ y considere el estadístico de prueba 
D = 2"=i (. R¡ ~ i) 2 - Entonces los valores pequeños de D dan 
apoyo a // a (por ejemplo, el valor más pequeño es 0 para 
R 1 — 1, R^ — 2, = n), de modo que H 0 debe ser 

rechazada a favor de 7/ a si d £ c. Cuando H 0 es verdadera, 
cualquier secuencia de rangos tiene probabilidad 1/n! Use 


esto con el fin de hallar c para la que tiene un nivel tan cerca¬ 
no a 0.10 como es posible en el caso n = 4. [Sugerencia: Ha¬ 
ga una lista de las secuencias de rango 4!, calcule d para cada 
una y luego obtenga la distribución nula de D. Vea el libro de 
Lehmann (en la bibliografía de este capítulo), p. 290, para 
más información.] 


| 15.2 Prueba Wilcoxon de suma de rangos 

Cuando es pequeño al menos uno de los tamaños muéstrales en un problema de dos mues¬ 
tras, la prueba t requiere la suposición de normalidad (al menos aproximadamente). Hay si¬ 
tuaciones, sin embargo, en las que un investigador desearía usar una prueba válida incluso 
si las distribuciones fundamentales son bastante no normales. A continuación se describe 
esa prueba, llamada prueba Wilcoxon de suma de rangos. Un nombre alternativo para el 
procedimiento es prueba Mann-Whitney, aun cuando el estadístico de la prueba Mann- 
Whitney se expresa a veces en una forma ligeramente diferente de la prueba Wilcoxon. 
El procedimiento de la prueba Wilcoxon es libre de distribución porque tendrá el nivel de¬ 
seado de significación para una clase muy grande de distribuciones fundamentales. 




SUPOSICIONES 


X¡, . . . , X m y Y[, . . . , Y n son dos muestras aleatorias independientes de distribucio¬ 
nes continuas con medias ¡± l y fi 2 , respectivamente. Las distribuciones X y Y tienen 
la misma forma y dispersión, con la única diferencia posible entre las dos estando en 
los valores de y /jl 2 . 




Cuando H 0 : p,, — /c 2 = A 0 es verdadera, la distribución X es desplazada por una cantidad 
A 0 a la derecha de la distribución Y, mientras que cuando H 0 es falsa el desplazamiento es 
por una cantidad diferente a A 0 . 

Desarrollo de la prueba cuando m = 3, n = 4 

Considere probar primero H 0 : /i 1 — ¡jl 2 = 0. Si /j,, es en realidad mucho mayor que en¬ 
tonces casi todas las x observadas caerán a la derecha de las y observadas. No obstante, si 
H 0 es verdadera, entonces los valores observados de las dos muestras deben estar entremez¬ 
clados. El estadístico de prueba dará una cuantificación de cuánta mezcla hay en las dos 
muestras. 

Considere el caso m = 3 ,n = 4. Entonces si las tres x observadas estuvieran a la de¬ 
recha de las cuatro y observadas, esto sería una fuerte evidencia para rechazar H 0 a favor de 
/-/,/ /x, — /j, 2 + 0; una conclusión semejante es apropiada si las tres x caen debajo de las cua¬ 
tro y. Suponga que se agrupan las X y las Y en una muestra combinada de tamaño m + n = 7 
y se ordenan estas observaciones de menor a mayor, con la más pequeña recibiendo el ran¬ 
go 1 y la mayor el rango 7. Si casi todos los rangos más grandes o los rangos más pequeños 
se asociaran con observaciones X, se empezaría a dudar de H 0 . Esto sugiere el estadístico de 
prueba 

W = la suma de los rangos de la muestra combinada (15 3) 

asociada con observaciones de X 

Para los valores de m y n bajo consideración, el valor más pequeño posible de W es w = 
1 + 2 + 3 = 6 (si las tres x son menores que las cuatro y), y el máximo valor posible es 
w = 5 + 6 + 7 = 18 (si las tres x son mayores que las cuatro y). 
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Como ejemplo, suponga que x r = -3.10, x 2 = 1.67, x 3 = 2.01, y 3 = 5.27, y 2 = 1.89, 
y 3 = 3.86 y y 4 = 0.19. Entonces la muestra ordenada agrupada es -3.10, 0.19, 1.67, 
1.89, 2.01, 3.86 y 5.27. Los rangos X para esta muestra son 1 (para —3.10), 3 (para 1.67) y 
5 (para 2.01), de modo que el valor calculado de W es w = I +3 + 5 = 9. 

El procedimiento de prueba basado en el estadístico (15.3) es rechazar H 0 si el valor 
calculado de w es “demasiado extremo”, es decir, > c para una prueba de cola superior, 
< c para una prueba de cola inferior, y ya sea > r:¡ o < c 2 para una prueba de dos colas. 
La(s) constante(s) crítica(s) c (c¡, c 2 ) deben escogerse de modo que la prueba tenga el nivel 
deseado de significación a. Para ver cómo debería hacerse esto, recuerde que cuando H 0 
es verdadera, las siete observaciones provienen de la misma población. Esto significa que 
bajo H 0 , cualquier posible triple de rangos asociado con las tres x, por ejemplo (1,4, 5), 
(3, 5, 6 ) o (5, 6 , 7) tiene la misma probabilidad que cualquier otro posible triple de rango. 
Como hay ( 3 ) = 35 posibles triples de rango, bajo H 0 cada triple de rango tiene probabilidad 
35 . De una lista de los 35 triples de rango y el valor w asociado con cada uno, la distribución 
de probabilidad de W puede determinarse de inmediato. Por ejemplo, hay cuatro triples de 
rango que tienen valor w de 11, (1, 3, 7), (1, 4, 6 ), (2, 3, 6 ) y (2, 4, 5), por lo que P(W =11) 
= jy. El resumen de la lista y cálculos aparece en la tabla 15.4. 


Tabla 15.4 Distribución de probabilidad de W (m = 3, n = 4) cuando H 0 
es verdadera 


w 

6 7 8 9 10 11 12 13 14 15 16 17 18 

P(W = w) 

11234454432 1 1 

35 35 35 35 35 35 35 35 35 35 35 35 35 




La distribución de la tabla 15.4 es simétrica alrededor del valor w = (6 + 18)/2 =12, 
que es el valor central de la lista ordenada de posibles valores de W. Esto es porque los dos 
triples de rango ( r, s, t ) (con r < s < t) y (8 — /, 8 — s, 8 — r) tienen valores de w simétri¬ 
cos alrededor de 12 , de modo que para cada triple con valor w debajo de 12 , hay un triple con 
valor w arriba de 12 en la misma cantidad. 

Si la hipótesis alternativa es Hy. p., — p , 2 > 0, entonces H 0 debe ser rechazada a favor 
de H d para valores W grandes. Si se escoge como la región de rechazo al conjunto de valo¬ 
res W {17, 18}, a = P(tipo I de error) = /^(rechazar H () cuando H 0 es verdadera) = P(W = 
17 o 18 cuando H 0 es verdadera) = yj + ~ ~ = 0.057; la región {17, 18} por tanto 

especifica una prueba con nivel de significación de alrededor de 0.05. Del mismo modo, la 
región { 6 , 7}, que es apropiada para Hy. p., — ¡i 2 < 0, tiene a = 0.057 ~ 0.05. La región 
{ 6 , 7, 17, 18}, que es apropiada para la alternativa de dos lados, tiene a = ^ = 0.114. El 
valor W para la información dada varios párrafos atrás era vw = 9, que está más bien cerca 
del valor central 12, de modo que H 0 no sería rechazada a ningún nivel a razonable para 
cualquiera de las tres H d . 

Descripción general de la prueba Wilcoxon 
de suma de rangos 

La hipótesis nula H 0 \ p., — ¡± n = A 0 se maneja restando A 0 de cada X¡ y usando las (X ! — A 0 ) 
como las X¡ se usaron previamente. Recordando que para cualquier entero positivo K, la su¬ 
ma de los primeros K enteros es K(K + l)/2, el mínimo valor posible del estadístico W es 
m(m + l)/2, que se presenta cuando las ( X¡ — A 0 ) están todas a la izquierda de la muestra 
Y. El máximo valor posible de W se presenta cuando las (X ¡ — A 0 ) están por completo a la 
derecha de las Y; en este caso, W = (n + 1) + • • • + (m + n) = (suma de los primeros 
m + n enteros) — (suma de los primeros n enteros), que da m(m + 2 n + l)/2. Al igual que 
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con el caso especial m = 3, n = 4, la distribución de W es simétrica alrededor del valor que 
está a la mitad entre los valores mínimo y máximo; este valor central es m(m + n + l)/ 2 . 
Debido a esta simetría, las probabilidades que comprenden valores críticos de cola inferior 
se pueden obtener de los correspondientes valores de cola superior. 


Hipótesis nula: H 0 : p ] — p 2 ~ 


Valor estadístico de prueba: w = r ¡ 

donde r¡ = rango de (x¡ — A 0 ) en la mués- 

i= 1 

tra combinada de las m + n(x — A 0 ) y las y 

Hipótesis alternativa 

Región de rechazo 

H¡¡- AL — AL • > 

W & C[ 

AL — AL 

w ^ m(m + n + 1) — c l 

H a : AL — AL ^ A 0 ya sea 

w & c o w s m(m + n + 1) — c 

donde P(W & c¡ cuando H 0 es verdadera) ~ a , P( W > c cuando H 0 es verdadera) ~ 
a/2. 


Debido a que W era una distribución de probabilidad discreta, no siempre existirá un 
valor crítico que corresponda exactamente a uno de los niveles usuales de significación. La 
tabla A. 14 del apéndice da valores críticos de cola superior para probabilidades más cerca¬ 
nas a 0.05, 0.025, 0.01 y 0.005, de cuyos niveles 0.05 y 0.01 se pueden obtener pruebas de 
una y dos colas. La tabla da información sólo para m = 3, 4,. . . , 8 y n = m, m + 1, .... 8 
(es decir, 3 < m < n < 8 ). Para valores de m y n que excedan de 8 , se puede usar una apro¬ 
ximación normal. No obstante, para usar la tabla para m y n pequeñas las muestras XyYde¬ 
ben marcarse para que m < n. 

Ejemplo 15.4 La concentración de fluoruro urinario (partes por millón) se midió para una muestra de ga¬ 
nado que pastaba en una zona previamente expuesta a contaminación de fluoruro y para una 
muestra similar que pastaba en una región sin contaminación: 


Contaminado 

21.3 

18.7 

23.0 

17.1 

16.8 20.9 19.7 

No contaminado 

14.2 

18.3 

17.2 

18.4 

20.0 


¿Esta información indica firmemente que el promedio verdadero de concentración de fluo¬ 
ruro, para ganado que pasta en la región contaminada, es mayor que para la región no con¬ 
taminada? Utilice la prueba Wilcoxon de prueba de rangos al nivel a = 0.01. 

Los tamaños muéstrales en este caso son 7 y 5. Para obtener m < n, marque las obser¬ 
vaciones no contaminadas como las x (x ] = 14.2, . .. ,x 5 = 20.0) y las observaciones conta¬ 
minadas como las y. De este modo, /i, es el promedio verdadero de concentración de 
fluoruros sin contaminación y es el promedio verdadero con contaminación. La hipótesis 
alternativa es A/ a : p l — p-, < 0 (la contaminación produce un aumento en concentración), 
de modo que es apropiada una prueba de cola inferior. De la tabla A. 14 del apéndice con m 
= 5 y n = 7, P(W > 47 cuando H 0 es verdadera) ~ 0.01. El valor crítico para la prueba de 
cola inferior es por tanto m(rn + n + 1) — 47 = 5(13) — 47 = 18 ; H 0 será rechazada aho¬ 
ra si w < 18. Sigue la muestra ordenada agrupada; la W calculada es w = r x + r 2 + ■ ■ ■ + 
r 5 (donde r¡ es el rango de x¡) = 1 + 5 + 4 4-6 + 9 = 25. Como 25 no es < 18, H 0 no es 
rechazada al nivel 0.01 (aproximado). 
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X 

y 

y 

X 

X 

X 

y 

y 

X 

y 

y 

y 

14.2 

16.8 

17.1 

17.2 

18.3 

18.4 

18.7 

19.7 

20.0 

20.9 

21.3 

23.0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 


Teóricamente, la suposición de continuidad de las dos distribuciones asegura que 
todas las x y las y observadas (m + n ) tengan valores diferentes. En la práctica, no obstan¬ 
te, con frecuencia habrá enlaces en los valores observados. Al igual que con la prueba Wil¬ 
coxon de rango con signo, la práctica común al trabajar con enlaces es asignar, a cada una 
de las observaciones enlazadas de un conjunto particular de enlaces, el promedio de los ran¬ 
gos que recibirían si fueran ligeramente diferentes entre sí. 


Una aproximación normal para W 

Cuando m y n exceden de 8 , la distribución de W puede ser aproximada por una curva nor¬ 
mal apropiada y esta aproximación se puede usar en lugar de la tabla A. 14 del apéndice. Pa¬ 
ra obtener la aproximación, se necesita /x w y (t\ v cuando H 0 es verdadera. En este caso, 
el rango R¡ de X¡ — A 0 es igualmente probable que sea cualquiera de los posibles valores 
1, 2, 3, . . . , m + n (R¡ tiene una distribución uniforme discreta en los primeros m + n en¬ 
teros positivos), de modo que ¡a R . = On + n + l)/2. Como W = X R¡, esto da 

m(m + n + 1) .. , .. 

Rw ~ Rr\ Rr 2 + ' ' ' + ~ 2 (15-4) 


La varianza de R i fácilmente se calcula también que es Un + n + 1 )(m + n — 1)/12. No 
obstante, como las R t no son variables independientes, V( W) A mV(R¡). Usando el hecho 
de que, para cualesquiera dos enteros distintos a y b entre 1 y m + n inclusive, P(R i = a, 
Rj = b) = 1 l[(m + n)(m + n — 1)] (dos enteros se muestrean con restitución), Co v(R¡, R¡) = 
— (m + n+ 1 )/ 12 , que da 


m 

< = I W + II Cov(/?„ R) 
i-i i+j 


mn(m + n + 1 ) 
12 


(15.5) 


Es posible usar un teorema de límite central para concluir que cuando H 0 es verdade¬ 
ra, el estadístico de prueba 



W — m(m + n + l)/2 
V»»í(/7í + n + 1)/12 

tiene aproximadamente una distribución normal estándar. Este estadístico se usa en conjun¬ 
ción con los valores críticos z a , ~z n y ±z a/2 para pruebas de cola superior, cola inferior y dos 
colas, respectivamente. 

Un artículo del Journal of Applied Physiology (“Histamine Content in Sputum from Aller- 
gic and Non-Allergic Individuáis”, 1969: 535-539) publica la siguiente información sobre 
el nivel de histamina en el esputo (/rg/g de peso seco de esputo), para una muestra de 9 in¬ 
dividuos clasificados como alérgicos y otra muestra de 13 individuos clasificados como no 
alérgicos: 


Alérgicos 67.6 39.6 1651.0 100.0 65.9 1112.0 31.0 102.4 64.7 

No alérgicos 34.3 27.3 35.4 48.1 5.2 29.1 4.7 41.7 48.0 6.6 18.9 32.4 45.5 
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¿Esta información indica que hay una diferencia en el promedio verdadero de nivel de his- 
tamina en esputo entre alérgicos y no alérgicos? 

Como ambos tamaños muéstrales exceden de 8 , se usa la aproximación normal. La 
hipótesis nula es H 0 : ¡jl 1 — = 0 y los rangos observados de las x¡ son r x = 18, r 2 = 11, 

r 3 = 22, r 4 = 19, r 5 = 17, r 6 = 21, r 7 = 7, r 8 = 20 y r 9 = 16, de modo que w = = 151. 

La media y varianza de W están dadas por /t i w = 9(23)/2 = 103.5 y a\ = 9(13)(23)/12 = 
224.25. Entonces 

151 - 103.5 

z ~ V224.25 ~ 3 ' 17 

La hipótesis alternativa es H¿. ¡l 1 — ¡x 2 ¥= 0, de modo que al nivel 0.01 la H 0 es rechazada 
si z > 2.58 oz< —2.58. Como 3.17 & 2.58, H 0 es rechazada y se concluye que hay una 
diferencia en el promedio verdadero de niveles de histamina en esputo (el artículo también 
utilizó la prueba Wilcoxon). ■ 


Si hay enlace en la información, el numerador de Z todavía es apropiado, pero el de¬ 
nominador debe ser sustituido por la raíz cuadrada de la varianza ajustada 


<j 


i 

w 


mn(m + n + 1 ) 
12 


mn 

12 (m + n)(m + n — 1 ) 


X( t¡ ~ 1 )(t,)(t, + 1) 


(15.6) 


donde t¡ es el número de observaciones enlazadas del í-ésimo conjunto de enlaces y la su¬ 
ma es sobre todos los conjuntos de enlaces. A menos que haya un gran número de enlaces, 
hay poca diferencia entre las ecuaciones (15.6) y (15.5). 


Eficiencia de la prueba Wilcoxon de suma de rangos 

Cuando las distribuciones que se muestrean son normales con cr l = cr 2 y por tanto tienen las 
mismas formas y dispersiones, se pueden usar la prueba t agrupada o la prueba Wilcoxon 
(la prueba t de dos muestras supone normalidad pero no varianzas iguales, de modo que las 
suposiciones que sirven de base a su uso son más restrictivas en un sentido y menos en otro 
que las suposiciones para la prueba Wilcoxon). En esta situación, la prueba t agrupada es 
mejor entre todas las pruebas posibles en el sentido de minimizar (i para cualquier a fija. 
Sin embargo, un investigador nunca puede estar absolutamente seguro de que se satisfacen 
las suposiciones fundamentales. Por tanto, es importante preguntar 1) cuánto se pierde 
al usar la prueba de Wilcoxon, en lugar de la prueba t agrupada, cuando las distribuciones 
son normales con iguales varianzas y 2) cómo se compara W con T en situaciones que no 
sean normales. 

La noción de eficiencia de prueba se discutió en la sección previa en relación con una 
prueba t de una muestra y la prueba Wilcoxon de rango con signo. Los resultados para 
las pruebas de dos muestras son iguales que los de las pruebas de una muestra. Cuando se 
cumplen tanto normalidad como iguales varianzas, la prueba de la suma de rango es aproxi¬ 
madamente 95% de eficiente que la prueba t agrupada en muestras grandes. Es decir, la 
prueba t dará las mismas probabilidades de error que la prueba Wilcoxon que usa tamaños 
muéstrales ligeramente más pequeños. Por otra parte, la prueba Wilcoxon siempre será al 
menos 86 % de eficiente que la prueba t agrupada y puede ser más eficiente si las distribu¬ 
ciones fundamentales son, en gran medida, no normales, en especial con colas gruesas. La 
comparación de la prueba Wilcoxon con la prueba t de dos muestras (no agrupada) es me¬ 
nos clara. No se sabe que la prueba t sea la mejor prueba en ningún sentido, de modo que 
parece seguro concluir que mientras las distribuciones de población tengan formas y disper¬ 
siones semejantes, el comportamiento de la prueba Wilcoxon debe compararse en forma 
bastante favorable con la prueba t de dos muestras. 
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15.2 Prueba Wilcoxon de suma de rangos 613 

Por último, se observa que los cálculos ¡3 para la prueba Wilcoxon son muy difíciles. 
Esto es porque la distribución de W cuando H 0 es falsa depende no sólo de ¡i¡ — ¡x 2 sino 
también de las formas de las dos distribuciones. Para casi todas las distribuciones funda¬ 
mentales, la distribución no nula de W es prácticamente intratable. Esta es la razón por la 
cual los expertos en estadística han creado una eficiencia de muestra grande (asintótica re¬ 
lativa) como medio de comparar pruebas. Con la capacidad de los modernos paquetes de 
software, otro método para el cálculo de ¡3 es realizar un experimento de simulación. 


EJERCICIOS Sección 15.2 (10-16) 


10 . En un experimento para comparar la resistencia de pega¬ 
mento de dos adhesivos diferentes, se utilizó cada adhesivo 
en cinco uniones de dos superficies y para cada unión se de¬ 
terminó la fuerza necesaria para separar las superficies. Para 
el adhesivo 1, los valores resultantes fueron 229, 286, 245, 
299 y 250, mientras que las observaciones para el adhesivo 
2 fueron 213, 179, 163, 247 y 225. Denótese con ¡jl¡ el pro¬ 
medio verdadero de resistencia de pegamento del adhesivo 
tipo i. Utilice la prueba Wilcoxon de prueba de rangos al ni¬ 
vel 0.05 para probar H 0 : ¿q = ¡jt 2 en función de /x¡ > /x 2 . 

11 . El artículo “A Study of Wood Stove Particulate Emissions” 
(7. Air Pollution Control Assn., 1979: 724-728) publica la 
información siguiente sobre el tiempo de combustión (en 
horas) para muestras de roble y pino. Pruebe al nivel 0.05 
para ver si hay alguna diferencia en el promedio verdadero 
de tiempo de combustión para los dos tipos de madera. 

Roble 1.72 0.67 1.55 1.56 1.42 1.23 1.77 0.48 

Pino 0.98 1.40 1.33 1.52 0.73 1.20 

12 . Se ha hecho una modificación al proceso para producir cier¬ 
to tipo de película de “tiempo cero” (película que empieza 
a revelarse tan pronto como se toma una foto). Debido a que 
la modificación implica un costo extra, será incorporada só¬ 
lo si los datos muéstrales indican firmemente que la modi¬ 
ficación ha reducido el promedio verdadero de tiempo de 
revelado en más de 1 segundo. Si se supone que las distri¬ 
buciones de tiempo de revelado difieren sólo con respecto 
al lugar, si es que difieren, utilice la prueba Wilcoxon de 
prueba de rangos al nivel 0.05 sobre la siguiente informa¬ 
ción para probar las hipótesis apropiadas. 


Proceso 


original 

Proceso 

8.6 

5.1 

4.5 

5.4 

6.3 

6.6 

5.7 

8.5 

modificado 

5.5 

4.0 

3.8 

6.0 

5.8 

4.9 

7.0 

5.7 


13 . La información que sigue resultó de un experimento para 
comparar los efectos de la vitamina C, de jugo de naranja y 
de ácido ascórbico sintético, sobre la duración de odonto- 
blastos en conejillos de Indias en un periodo de seis sema¬ 
nas (“The Growth of the Odontoblasts of the Incisor Tooth 
as a Criterion of the Vitamin C Intake of the Guinea Pig”, 
J. Nutrition, 1947: 491-504). Utilice la prueba Wilcoxon de 
prueba de rangos al nivel 0.01 para determinar si el prome¬ 
dio verdadero de duración difiere para los dos tipos de in¬ 
gesta de vitamina C. Calcule también un valor p apropiado. 


Jugo de naranja 

8.2 

9.4 

9.6 

9.7 

10.0 

14.5 


15.2 

16.1 

17.6 

21.5 



Ácido ascórbico 

4.2 

5.2 

5.8 

6.4 

7.0 

7.3 


10.1 

11.2 

11.3 

11.5 




14 . Pruebe las hipótesis sugeridas en el ejercicio 13 usando la 
información siguiente: 


Jugo de naranja 

8.2 

9.5 

9.5 

9.7 

10.0 14.5 


15.2 

16.1 

17.6 

21.5 


Ácido ascórbico 

4.2 

5.2 

5.8 

6.4 

7.0 7.3 


9.5 

10.0 

11.5 

11.5 



15 . El artículo “Measuring the Exposure of Infants to Tobbaco 
Smoke” (N. Engl. J. Med., 1984: 1075-1078) informa sobre 
un estudio en el que se tomaron varias medidas, tanto de una 
muestra aleatoria de infantes que habían estado expuestos al 
humo en una casa como de una muestra de infantes no ex¬ 
puestos. La información siguiente consta de observaciones 
en concentración de cotanina urinaria, metabolito importante 
de la nicotina (los valores son un subconjunto de la informa¬ 
ción original y se leyeron de una gráfica que apareció en el 
artículo). ¿La información sugiere que el promedio verdade¬ 
ro de nivel de cotanina es más alto, en más de 25, en infan¬ 
tes expuestos que en los no expuestos? Realice una prueba 
al nivel de significación de 0.05. 

No expuestos 8 11 12 14 20 43 111 

Expuestos 35 56 83 92 128 150 176 208 

16 . Reconsidere la situación descrita en el ejercicio 79 del ca¬ 
pítulo 9 y de la siguiente salida MINITAB (la letra griega 
eta se emplea para denotar una mediana). 

Mann-Whitney Confidence Interval and Test 

good N=8 Median =0.540 

poor N=8 Median = 2.400 

Point estimate for ETA1-ETA2 is -1.155 

95.9 Percent CI for ETA1-ETA2 is (-3.160, -0.409) 
W = 41.0 

Test of ETA1 = ETA2 vs ETA1 < ETA2 is significant 
at 0.0027 

a. Verifique que el valor del estadístico de prueba de MI- 
NITAB es correcto. 

b. Realice una prueba apropiada de las hipótesis usando un 
nivel de significación de 0.01. 
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| 15.3 Intervalos de confianza sin distribución 

El método empleado hasta aquí para construir un intervalo de confianza (IC) se puede des¬ 
cribir como sigue: inicie con una variable aleatoria (Z, T, x 2 , F u otras semejantes) que 
depende del parámetro de interés y un enunciado de probabilidad que comprenda la varia¬ 
ble, manipule las desigualdades del enunciado para aislar el parámetro entre puntos extre¬ 
mos aleatorios y finalmente sustituya los valores calculados para variables aleatorias. Otro 
método general para obtener intervalos de confianza se aprovecha de una relación entre pro¬ 
cedimientos de prueba y los intervalos de confianza. Un intervalo de confianza de 100(1 — a)% 
para un parámetro 9 se puede obtener de una prueba de nivel a para H 0 : 0 = 6 fl en función 
de // a : 9 A 6 0 . Este método se utilizará para deducir intervalos asociados con la prueba Wil- 
coxon de rango con signo y la prueba Wilcoxon de prueba de rangos. 

Antes de usar el método para deducir nuevos intervalos, reconsidere la prueba t y el 
intervalo t. Suponga que una muestra aleatoria de n = 25 observaciones de una población 
normal da estadísticas breves x = 100, s = 20. Entonces un intervalo de confianza de 90% 
para p es 

^ ~ * 0 . 05,24 ‘ y/25 ’ * í()05 ' 24 ' x/25 ) = ^3-16, 106.84) (15.7) 


Suponga que en lugar de un intervalo de confianza se desea probar una hipótesis acerca de p. 
Para H 0 : p = p 0 en función de Z/ a : p A p 0 , la prueba t al nivel 0.10 especifica que H 0 debe 
ser rechazada sites > 1.711 o < —1.711, donde 


x — p 0 100 — | x 0 100 — p 0 

s/V25 ~ 20/V25 ~~ 4 


(15.8) 


Considere ahora el valor nulo p 0 = 95. Entonces t = 1.25 de modo que //„ no es re¬ 
chazada. Del mismo modo, si p 0 = 104, entonces t = — 1 por lo que de nuevo H 0 no es 
rechazada. No obstante, si p 0 = 90, entonces t = 2.5 y H 0 es rechazada y si p {) = 108, en¬ 
tonces t = —2 y H 0 es de nuevo rechazada. Al considerar otros valores de /x (l y la decisión 
resultante de cada uno, emerge el siguiente dato general: Todo número dentro del intervalo 
(15.7) especifica un valor para pt 0 para el que t de (15.8) lleva al no rechazo de H 0 , mien¬ 
tras que todo número fuera del intervalo (15.7) corresponde a una t para la que H 0 es re¬ 
chazada. Es decir, para los valores fijos de n, x y ,y, el conjunto de todos los valores p 0 para 
los que probar H 0 : p. = /x 0 en función de H, '. /x T /x () resulta en no rechazo de H 0 es preci¬ 
samente el intervalo (15.7). 


PROPOSICIÓN 


Suponga que se tiene un procedimiento de prueba de nivel a para probar f/ 0 : 6 = 0 0 
en función de // a : 0 A 6 0 . Para valores muéstrales fijos, denótese con A el conjunto 
de todos los valores 9 0 para los cuales H 0 no es rechazada. Entonces A es un interva¬ 
lo de confianza de 100(1 — a)% para 0. 


En realidad hay ejemplos patológicos en los que el conjunto A definido en la propo¬ 
sición no es un intervalo de valores 9, sino que es el complemento de un intervalo o algo to¬ 
davía más extraño. Para ser más precisos, se debería sustituir realmente la noción de un 
intervalo de confianza con la de un conjunto de confianza. En los casos de interés aquí, el 
conjunto A resulta ser un intervalo. 


El intervalo Wilcoxon de rango con signo 

Para probar H 0 : ¡x = p, () en función de H ñ : p T /j, 0 usando la prueba Wilcoxon de rango con 
signo, donde p es la media de una distribución simétrica continua, los valores absolutos 
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| Xj — p, 0 1, . . . , | x n — /u, 0 | se ordenan de menor a mayor, con el más pequeño recibiendo 
rango 1 y, el mayor, rango n. A cada rango se da entonces el signo de su x¡ — ¡jl 0 asociada, 
y el estadístico de prueba es la suma de los rangos con signo positivo. La prueba de dos co¬ 
las rechaza H 0 si .v ( es > c o < n(n + l)/2 — c, donde c se obtiene de la tabla A. 13 del apén¬ 
dice una vez especificado el nivel deseado de significación a. Para x¡, ... , x n fijas, el 
intervalo de rango con signo 100(1 — a)% estará formado por todas las ¡jl 0 para las que 
H 0 : [jl = ¡± {) no es rechazada al nivel a. Para identificar este intervalo, es conveniente expre¬ 
sar el estadístico de prueba S , en otra forma. 


S + = el número de promedios por pares (X¡ + X )/2 con i < j que 
son > p, 0 


Esto es, si se promedia cada una de las Xj de la lista con cada una de las x¡ a su izquierda, 
incluyendo ( x¡ + Xj)/2 (que es sólo x), y se cuenta el número de estos promedios que sean 
£ ¡jl 0 , resulta s + . Al moverse de izquierda a derecha en la lista de valores muéstrales, sim¬ 
plemente se está promediando cada par de observaciones de la muestra [otra vez incluyen¬ 
do (Xj + xp/2] exactamente una vez, de modo que el orden en que se ponen en lista las 
observaciones no es importante. La equivalencia de los dos métodos para calcular s + no es 
difícil de verificar. El número de promedios por pares es (") 4- n (el primer término se debe 
a promediar diferentes observaciones y el segundo a promediar cada x¡ con sí misma), que 
es igual a n(n + l)/2. Si demasiados, o demasiado pocos, de estos promedios por pares son 
& p 0 , H q es rechazada. 

Las siguientes observaciones son valores de ritmo metabólico cerebral para monos rhesus: 
x l = 4.51, x 2 = 4.59, x 3 = 4.90, x 4 = 4.93, x 5 = 6.80, x 6 = 5.08, x 7 = 5.67. Los 28 prome¬ 
dios por pares son, en orden creciente. 


4.51 

4.55 

4.59 

4.705 

4.72 

4.745 

4.76 

4.795 

4.835 

4.90 

4.915 

4.93 

4.99 

5.005 

5.08 

5.09 

5.13 

5.285 

5.30 

5.375 

5.655 

5.67 

5.695 

5.85 

5.865 

5.94 

6.235 

6.80 





Los primeros pocos, y los pocos últimos, de éstos se presentan en un eje de mediciones en 
la figura 15.2. 



3 < s+ < 25 



-+• 

4.5 


H-- 1 « » »—I-« « « I «—• 

4.6 4.7 4.8 5.5 5.75 ¡6 

Aquí en el nivel 0.0469, Hq es aceptada para ¡jíq. \ 


= 0 


Figura 15.2 Gráfica de los datos para el ejemplo 15.6. 


Debido a lo discreto de la distribución de S + , a = 0.05 no se puede obtener de mane¬ 
ra exacta. La región de rechazo [0, 1, 2, 26, 27, 28} tiene a = 0.046, que es tan cercano co¬ 
mo es posible a 0.05, de modo que el nivel es aproximadamente 0.05. De este modo, si el 
número de promedios por pares > p 0 es entre 3 y 25, inclusive, H 0 no es rechazada. De la 
figura 15.2 el intervalo de confianza (aproximado) de 95% para ¡jl es (4.59, 5.94). ■ 


En general, una vez que los promedios por pares sean ordenados de menor a mayor, 
los puntos extremos del intervalo Wilcoxon son dos de los promedios “extremos”. Para ex¬ 
presar esto con precisión, denótese por 3c (1) el promedio por pares más pequeño, el siguien¬ 
te más pequeño por x (2) , . . . , y el más grande por x ( „ ( „ +1 y 2 )- 
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PROPOSICIÓN 


Ejemplo 15.7 

(continúa el 
ejemplo 15.6) 


Si la prueba Wilcoxon de rango con signo de nivel a para H 0 \ ¡jl = [jl 0 contra H d : ¡± # ¡x 0 
es para rechazar H 0 si s + > c o s + < n(n + l)/2 — c, entonces un intervalo de con¬ 
fianza 100(1 — a)% para /r es 

( X (n(jl+l)l2~c+\y X (c) (15.10) 


En otras palabras, el intervalo se extiende desde el c/-ésimo más pequeño promedio por 
pares al c/-ésimo promedio más grande, donde d = n(n + l)/2 — c + 1. La tabla A. 15 del 
apéndice da los valores de c que corresponden a los niveles para n = 5, 6, ... , 25. 

Para n = 7, se obtiene un intervalo de 89.1% (aproximadamente 90%) con el uso de c = 24 
(porque la región de rechazo {0, 1, 2, 3, 4, 24, 25, 26, 27, 28} tiene a = 0.109). El interva¬ 
lo es (X (28 — 24+ i), x ( 24 )) = (x (5) , x (2 4 )) = (4.72, 5.85), que se extiende desde el quinto prome¬ 
dio más pequeño al quinto promedio por pares más grande. ■ 

La deducción del intervalo dependía de tener una sola muestra de una distribución si¬ 
métrica continua con media (mediana) ¡i. Cuando la información es apareada, el intervalo 
construido desde las diferencias d { , d 2 , . . . , d n es un intervalo de confianza para la diferen¬ 
cia media (mediana) ¡jl d . En este caso, no es necesario suponer la simetría de las distribucio¬ 
nes X y Y; mientras las distribuciones X y Y tengan la misma forma, la distribución X — Y 
será simétrica, por lo que sólo se requiere continuidad. 

Para n > 20, la aproximación de muestra grande a la prueba Wilcoxon basada en es¬ 
tandarizar S + da una aproximación a c en (15.10). El resultado [para un intervalo 100(1 — 
a )%] es 

n(n + 1) lX2w _ -¡- 1)^ 

C ” 4 -24- 

La eficiencia del relativo intervalo Wilcoxon con respecto al intervalo t es aproximada¬ 
mente igual que el relativo para la prueba Wilcoxon con respecto a la prueba t. En particular, 
para muestras grandes cuando la población fundamental es normal, el intervalo Wilcoxon 
tenderá a ser un poco más largo que el intervalo t, pero si la población es no normal en sufi¬ 
ciente grado (simétrica pero con colas gruesas), entonces el intervalo Wilcoxon tenderá a ser 
mucho más corto que el intervalo t. 


El intervalo Wilcoxon de prueba de rangos 

La prueba Wilcoxon de prueba de rangos para probar H 0 : — /x 2 = A (l se realiza al com¬ 

binar primeramente ( X¡ — A 0 ) y las K en una muestra de tamaño m + n y ordenarlas de me¬ 
nor (rango 1) a mayor (rango m + n). El estadístico de prueba W es entonces la suma de los 
rangos de las (X¡ — A 0 ). Para la alternativa de dos lados, H 0 es rechazada si w es demasiado 
pequeña o demasiado grande. 

Para obtener el intervalo de confianza asociado para las x¡ y las y ; fijas, se debe deter¬ 
minar el conjunto de todos los valores A 0 para los que H 0 no es rechazada. Esto es más fácil 
de hacer si primero se expresa el estadístico de prueba en una forma ligeramente diferen¬ 
te. El valor más pequeño posible de W es m(m + l)/2, correspondiente a cada ( X¡ — A 0 ) 
menos que cada Y-, y hay mn diferencias de la forma (X ¡ — A 0 ) — Y f . Un poco de manipu¬ 
lación da 


W = [número de (X¡ — Y- — A 0 ) s & 0] + 


m(m + 1) 


= [número de ( X¡ — Y¡) s > A 0 ] + 


m(m +1) 


(15.11) 


2 
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Entonces, el rechazo de H 0 si el número de las (x¡ — y) > A 0 es demasiado pequeño o de¬ 
masiado grande equivale a rechazar H 0 para w pequeña o grande. 

La expresión (15.11) sugiere que se calcule x¡ — y. para cada i y j y se ordenen estas 
mn diferencias de menor a mayor. Entonces, si el valor nulo A 0 no es más pequeño que la ma¬ 
yor parte de las diferencias ni mayor que casi todas, H 0 : /x, — ¡x 2 = A 0 no es rechazada. La 
variación de A 0 muestra ahora que un intervalo de confianza para p ¡ — ¡jl 2 tendrá como su 
punto extremo inferior una de las (x ¡ — y) y análogamente para el punto extremo superior. 


Sean x u . . . , x m y y lt . . . , y n los valores observados en dos muestras independientes 
de distribuciones continuas que difieren sólo en ubicación (y no en forma). Con 
d¡j = x¡ — yj y las diferencias ordenadas denotadas por d ¡j(Vj , c/- (2) , . . . , la forma 
general de un intervalo de confianza 100(1 — a)% para p, — p 2 es 

(4>'(m«-c+1)’ “¡>(c)) (15.12) 

donde c es la constante crítica para la prueba Wilcoxon de prueba de rangos de nivel a 
de dos colas. 


Nótese que la forma del intervalo Wilcoxon de prueba de rango (15.12) es muy semejante 
al intervalo Wilcoxon de rango con signo (15.10); (15.10) emplea promedios por pares de 
una sola muestra, mientras que (15.12) usa diferencias por pares de dos muestras. La tabla 
A. 16 del apéndice da valores de c para valores seleccionados de m y n. 

El artículo “Some Mechanical Properties of Impregnated Bark Board” (Forest Products J. 
1977: 31-38) publica la siguiente información sobre la máxima resistencia a la compresión 
(por pulgada cuadrada), para una muestra de tabla de corteza de impregnación epóxica y pa¬ 
ra una muestra de tabla de corteza impregnada con otro polímero: 



Epóxica (dex) 10860 11 120 11340 12130 14380 13070 

Otro (de y) 4590 4 850 6510 5 640 6390 


Obtenga un intervalo de confianza de 95% para el promedio verdadero de diferencia en re¬ 
sistencia a la compresión entre la tabla de impregnación epóxica y la tabla con el otro tipo. 

De la tabla A. 16 del apéndice, puesto que el tamaño muestral más pequeño es 5 y el 
tamaño muestral más grande es 6, c = 26 para un nivel de confianza de aproximadamente 
95%. Las d¡j aparecen en la tabla 15.5. Las cinco d¡j más pequeñas [d ]J{ , } ,..., d ij(5) ] son 4350, 
4470, 4610, 4730 y 4830 y las cinco más grandes son (en orden descendente) 9790, 9530, 
8740, 8480 y 8220. Entonces el intervalo de confianza es (d^, í/- (26) ) = (4830, 8220). 


Tabla 15.5 Diferencias para el intervalo de prueba de rangos del ejemplo 15.8 



4590 

4850 

yj 

5640 

6390 

6510 

10860 

6270 

6010 

5220 

4470 

4350 

11120 

6530 

6270 

5480 

4730 

4610 

x¡ 11340 

6750 

6490 

5700 

4950 

4830 

12130 

7540 

7280 

6490 

5740 

5620 

13070 

8480 

8220 

7430 

6680 

6560 

14380 

9790 

9530 

8740 

7990 

7870 
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Cuando m y n son grandes, el estadístico de prueba Wilcoxon tiene aproximadamen¬ 
te una distribución normal. Ésta se puede usar para deducir una aproximación de muestra 
grande para el valor c en el intervalo (15.12). El resultado es 

mn , mn(m + n+ 1) 

+ W- ñ - (15 ' 13) 

Al igual que con el intervalo de rango con signo, el intervalo de prueba de rangos 
(15.12) es muy eficiente con respecto al intervalo í; en muestras grandes, (15.12) tenderá a 
ser sólo un poco más larga que el intervalo t, cuando las poblaciones fundamentales son nor¬ 
males, y puede ser considerablemente más corta que el intervalo t si las poblaciones funda¬ 
mentales tienen colas más gruesas que las poblaciones normales. 


EJERCICIOS Sección 15.3 (17-22) 


17 . El artículo “The Lead Content and Acidity of Christchurch 
Precipitation” (New Zealand J. Science, 1980: 311-312) pu¬ 
blica los datos siguientes sobre la concentración de plomo 
(jug/1) en muestras tomadas durante lluvias diferentes en ve¬ 
rano: 17.0, 21.4, 30.6, 5.0, 12.2, 11.8, 17.3 y 18.8. Supo¬ 
niendo que la distribución del contenido de plomo sea 
simétrica, utilice el intervalo Wilcoxon de rango con signo 
para obtener un intervalo de confianza de 95% para ¡x. 

18 . Calcule un intervalo de rango con signo de 99% para el pro¬ 
medio verdadero de pH /r. (suponiendo simetría) usando los 
datos del ejercicio 3. [Sugerencia: Trate de calcular sólo 
los promedios apareados que tengan valores relativamente 
pequeños o grandes (en lugar de los 105 promedios).] 

19 . Calcule un intervalo de confianza para /x D del ejemplo 15.2 
usando los datos dados ahí; el nivel de confianza del lector 
debe ser aproximadamente de 95%. 


20 . Las siguientes observaciones son cantidades de emisiones 
de hidrocarburos, que resultan del desgaste en pavimento de 
neumáticos de banda en diagonal bajo una carga de 522 kg 
infladas a 228 kPa y corriendo a 64 km/h durante 6 horas 
(“Characterization of Tire Emissions Using an Indoor Test 
Facility”, Rubber Chemistry and Technology, 1978: 7-25): 
0.045, 0.117, 0.062 y 0.072. ¿Qué niveles de confianza se 
pueden alcanzar para este tamaño muestral si se usa el in¬ 
tervalo de rango con signo? Seleccione un nivel de confian¬ 
za apropiado y calcule el intervalo. 

21 . Calcule el intervalo de confianza de prueba de rangos de 
90% para ¡jl¡ — /x 2 usando los datos del ejercicio 10. 

22. Calcule el intervalo de confianza de 99% para fx l — ¡x 2 
usando los datos del ejercicio 11. 


| 15.4 ANOVA sin distribución 

El modelo ANOVA de un solo factor del capítulo 10, para comparar I medias de una pobla¬ 
ción o tratamiento, significa suponer que para i = 1 , 2 ,...,/, una muestra aleatoria de 
tamaño J¡ se extrajo de una población normal con media f±¡ y varianza er 2 . Esto se puede es¬ 
cribir como 


A), M, - f, j = 1, i = 1,.... / (15.14) 

donde las e- están independiente y normalmente distribuidas con media cero y varianza ir 2 . 
Aun cuando la suposición de normalidad se requirió para la validez de la prueba F descrita 
en el capítulo 10, la validez de la prueba Kruskal-Wallis para probar la igualdad de las /x ( 
depende sólo de las e- que tengan la misma distribución continua. 

La prueba Kruskal-Wallis 

Sea N = Y,J¡, el número total de observaciones del conjunto de datos, y suponga que se or¬ 
denan todas las N observaciones de 1 (la X tj más pequeña) a N (la X¡- más grande). Cuando 
H 0 : ¡i 1 = i¿ 2 = ■ ■ ■ = ¡Xj es verdadera, las N observaciones provienen todas de la misma distri¬ 
bución, en cuyo caso todas las posibles asignaciones de los rangos 1, 2,. .., N a las muestras I 
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son igualmente probables y se espera que los rangos se mezclen en estas muestras. Pero, si 
H 0 es falsa, entonces algunas muestras estarán formadas sobre todo de observaciones que 
tengan rangos pequeños en la muestra combinada, mientras que otras estarán formadas prin¬ 
cipalmente de observaciones que tengan rangos grandes. En forma más específica, si R ;/ 
denota el rango de X tJ entre las N observaciones y R r y R r denotan, respectivamente, el to¬ 
tal y promedio de los rangos de la í-ésima muestra, entonces cuando 77 0 es verdadera 


E{R Ü ) 


N+ 1 
2 


E(R,) = jXE(R ij ) 
J < j 


N+ 1 
2 


El estadístico de prueba Kruskal-Wallis es una medida de la magnitud a la que las R¡. se 
desvían de su valor esperado común (N + l)/2 y 77 0 es rechazada si el valor calculado del 
estadístico indica una discrepancia demasiado grande entre promedios de rango observados 
y esperados 



La segunda expresión para K es la fórmula computacional; comprende los totales de rango 
(R ¡.) más que los promedios y requiere sólo una resta. 

Si 77 0 es rechazada cuando k > c, entonces c debe seleccionarse de modo que la prue¬ 
ba tenga nivel a. Esto es, c debe ser el valor crítico de cola superior de la distribución de K 
cuando 77 0 sea verdadera. Bajo 77 0 , cada asignación posible de los rangos de las muestras I es 
igualmente probable, de modo que en teoría todas las asignaciones se pueden enumerar, el 
valor de K determinarse para cada una y obtenerse la distribución nula al contar el número 
de veces que se presente cada uno de los valores de K. Es evidente que este cálculo es tedio¬ 
so, de manera que aun cuando hay tablas de la distribución nula exacta y valores críticos pa¬ 
ra valores pequeños de las J¡, se usará la siguiente aproximación de “muestra grande”. 



Cuando 77 0 es verdadera y 

7=3 J¡> 6 (¿=1,2,3) 

o 

7 > 3 J¡> 5 (i = 1,.... 7) 

entonces K tiene aproximadamente una distribución ji cuadrada con 7 — 1 grados de 
libertad. Esto implica que una prueba con nivel de significación aproximado a recha¬ 
za T7 0 si k>x 2 nJ - V 


Las observaciones siguientes (tabla 15.6), sobre el índice de rigidez axial, resultaron de un 
estudio de armazones conectadas con placas metálicas en las que se usaron cinco diferentes 
longitudes de placa: 4, 6, 8, 10 y 12 pulgadas (“Modeling Joints Made with Light-Gauge 
Metal Connector Plates” Forest Products J., 1979: 39-44). 
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Tabla 15.6 Datos y rangos para el ejemplo 15.9 


i 

= 1 ( 4 "): 

309.2 

309.7 

311.0 

316.8 

326.5 

349.8 

409.5 

i 

= 2 ( 6 "): 

331.0 

347.2 

348.9 

361.0 

381.7 

402.1 

404.5 

i 

= 3 ( 8 "): 

351.0 

357.1 

366.2 

367.3 

382.0 

392.4 

409.9 

i 

= 4 ( 10 "): 

346.7 

362.6 

384.2 

410.6 

433.1 

452.9 

461.4 

i 

= 5 ( 12 "): 

407.4 

410.7 

419.9 

441.2 

441.8 

465.8 

473.4 









r ¡- 

r r 

i 

= 1 

1 

2 

3 

4 

5 10 

24 

49 

7.00 

i 

= 2 

6 

8 

9 

13 

17 21 

22 

96 

13.71 

Rangos i 

= 3 

11 

12 

15 

16 

18 20 

25 

117 

16.71 

i 

= 4 

7 

14 

19 

26 

29 32 

33 

160 

22.86 

i 

= 5 

23 

27 

28 

30 

31 34 

35 

208 

29.71 



El valor calculado de K es 


k =- 

35(36) 


(49 ) 2 (96f (1 17) 2 (160) 2 (208) 2 

7 7 7 7 7 


- 3(36) 


= 20.12 


Al nivel 0.01, Xooi 4 = 13-277 y como 20.12 > 13.277, 77 0 es rechazada y se concluye que 
la rigidez axial esperada depende de la longitud de placas. ■ 


Prueba de Friedman para un experimento 
de bloque aleatorizado 

Suponga que X- = ¡i + ot¡ + /3 - + e (/ , donde a ¡ es el í-ésimo efecto de tratamiento, /3 - es el 
y-ésimo efecto de bloque y las e- se extraen de manera independiente de la misma distribu¬ 
ción continua (pero no necesariamente normal). Entonces para probar 77 0 : a 1 = a 2 = ■ ■ ■ = 
a¡ = 0, la hipótesis nula de efectos sin tratamiento, primero se ordenan las observaciones en 
forma separada de 1 a 7 dentro de cada bloque y luego se calcula el promedio de rango r¡. 
para cada uno de los tratamientos 7. Cuando 77 0 es verdadera, las ~r¡. deben ser cercanas en¬ 
tre sí, puesto que dentro de cada bloque todas las 7! asignaciones de rangos a tratamientos 
son igualmente probables. El estadístico de prueba de Friedman mide la discrepancia entre 
el valor esperado (7 + l)/2 de cada promedio de rango y las r¡.. 


ESTADÍSTICO DE PRUEBA 


F = 


12 J 

KI+ 1) 





12 

7/(7 + 1) 


URj. - 3/(7 + 1) 


Al igual que con la prueba Kruskal-Wallis, la prueba de Friedman rechaza 77 0 cuando el va¬ 
lor calculado del estadístico de prueba es demasiado grande. Para los casos 7=3,/ = 
2,..., 15 e 7 = 4, J = 2, . . . , 8, el libro de Lehmann (vea bibliografía del capítulo) da los 
valores críticos de cola superior para la prueba. De modo alternativo, para valores pares mo¬ 
derados de /, el estadístico de prueba F r tiene aproximadamente una distribución ji cuadrada 
con 7—1 grados de libertad cuando 77 0 es verdadera, de modo que 77 0 puede ser rechazada 
Sí/, ' Xlj-y 

Ejemplo 15.10 El artículo “Physiological Effects During Hypnotically Requested Emotions” ( Psychosoma- 
tic Med., 1963: 334-343) publica la siguiente información (tabla 15.7) sobre el potencial en 
la piel (mV) cuando las emociones de temor, alegría, depresión y calma se solicitaron de ca¬ 
da uno de ocho sujetos. 
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Tabla 15.7 Datos y rangos para el ejemplo 15.10 


Bloques (sujetos) 


x ü 

1 

2 

3 

4 

5 

6 

7 

8 



Temor 

23.1 

57.6 

10.5 

23.6 

11.9 

54.6 

21.0 

20.3 



Alegría 

22.7 

53.2 

9.7 

19.6 

13.8 

47.1 

13.6 

23.6 



Depresión 

22.5 

53.7 

10.8 

21.1 

13.7 

39.2 

13.7 

16.3 



Calma 

22.6 

53.1 

8.3 

21.6 

13.3 

37.0 

14.8 

14.8 



Rangos 

1 

2 

3 

4 

5 

6 

7 

8 

r ¡- 

d 

Temor 

4 

4 

3 

4 

1 

4 

4 

3 

21 

729 

Alegría 

3 

2 

2 

1 

4 

3 

1 

4 

20 

400 

Depresión 

1 

3 

4 

2 

3 

2 

2 

2 

19 

361 

Calma 

2 

1 

1 

3 

2 

1 

3 

1 

14 

196 


1686 


Así, 


/r= 4(8X57 (1686)_3(8)(5) = 6 ' 45 

Al nivel 0.05, A'oos 3 = 7-815 y como 6.45 no es > 7.815, H 0 no es rechazada. No hay evi¬ 
dencia de que el promedio de potencial en la piel dependa de qué emoción se pida. ■ 

El libro de Myles Hollander y Douglas Wolfe (vea bibliografía del capítulo) examina 
múltiples procedimientos de comparación asociados con las pruebas Kruskal-Wallis y Fried- 
man, así como otros aspectos de ANOVA sin distribución. 


EJERCICIOS Sección 15.4 (23-27) 


23. La información siguiente se refiere a la concentración del 
isótopo radiactivo estroncio-90, obtenida en muestras de le¬ 
che de cinco lecherías seleccionadas al azar en cuatro regio¬ 
nes diferentes. 


Región 


1 

6.4 

5.8 

6.5 

7.7 

6.1 

2 

7.1 

9.9 

11.2 

10.5 

8.8 

3 

5.7 

5.9 

8.2 

6.6 

5.1 

4 

9.5 

12.1 

10.3 

12.4 

11.7 


Pruebe al nivel 0.10 para ver si el promedio verdadero de la 
concentración de estroncio-90 difiere en al menos dos de 
las regiones. 

24 . El artículo “Production of Gaseous Nitrogen in Human 
Steady-State Conditions” ( J. Applied Physiology, 1972: 155- 
159) publica las siguientes observaciones sobre la cantidad 
de nitrógeno espirado (en litros) bajo cuatro regímenes de 
dieta: 1) ayuno, 2) 23% de proteínas, 3) 32% de proteínas, 
y 4) 67% de proteínas. Utilice la prueba Kruskal-Wallis al ni¬ 
vel 0.05 para probar la igualdad de las p, correspondientes. 


1 . 

4.079 

4.859 

3.540 

5.047 

3.298 

2. 

4.368 

5.668 

3.752 

5.848 

3.802 

3. 

4.169 

5.709 

4.416 

5.666 

4.123 

4. 

4.928 

5.608 

4.940 

5.291 

4.674 

1 . 

4.679 

2.870 

4.648 

3.847 


2. 

4.844 

3.578 

5.393 

4.374 


3. 

5.059 

4.403 

4.496 

4.688 


4. 

5.038 

4.905 

5.208 

4.806 



25 . Los datos siguientes sobre el nivel de hidrocortisona se pu¬ 
blicaron en el artículo “Cortisol, Cortisone, and 11-Deoxy- 
cortisol Levels in Human Umbilical and Maternal Plasma 
in Relation to the Onset of Labor” ( J. Obstetric Gynaeco- 
logy British Commonwealth, 1974: 737-745). Los sujetos 
experimentales fueron mujeres cuyos bebés nacieron con 
gestación entre 38 y 42 semanas. Las mujeres del grupo 1 
eligieron dar a luz por operación cesárea antes de principiar el 
trabajo de parto, y las del grupo 2 dieron a luz por cesárea 
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622 CAPITULO 15 Procedimientos libres de distribución 

de emergencia durante un trabajo de parto inducido y las 
del grupo 3 experimentaron un trabajo de parto espontáneo. 
Utilice la prueba Kuskal-Wallis al nivel 0.05 para probar la 
igualdad de las tres medias poblacionales. 


Grupo 1 

262 

307 

211 

323 

454 

339 


304 

154 

287 

356 



Grupo 2 

465 

501 

455 

355 

468 

362 

Grupo 3 

343 

772 

207 

1048 

838 

687 


26. En una prueba para determinar si un suelo tratado previa¬ 
mente con pequeñas cantidades de Basic-H hace que el sue¬ 
lo sea más permeable al agua, unas muestras de suelo se 
dividieron en bloques y cada uno de éstos recibió los cuatro 
tratamientos bajo estudio. Los tratamientos fueron A agua 
con 0.001% de Basic-H hasta cubrirla con tierra de control, 
B agua sin Basic-H en tierra de control, C agua con Basic-H 
cubierta con tierra tratada previamente con Basic-H y 
D agua sin Basic-H sobre tierra tratada previamente con 
Basic-H. Pruebe a un nivel 0.01 para ver si hay algún efec¬ 
to debido a los diversos tratamientos. 

Bloques 



1 

2 

3 

4 

5 

A 

37.1 

31.8 

28.0 

25.9 

25.5 

B 

33.2 

25.3 

20.2 

20.3 

18.3 

C 

58.9 

54.2 

49.2 

47.9 

38.2 

D 

56.7 

49.6 

46.4 

40.9 

39.4 



6 

7 

8 

9 

10 

A 

25.3 

23.7 

24.4 

21.7 

26.2 

B 

19.3 

17.3 

17.0 

16.7 

18.3 

C 

48.8 

47.8 

40.2 

44.0 

46.4 

D 

37.1 

37.5 

39.6 

35.1 

36.5 


27. En un experimento para estudiar la forma en la que diferen¬ 
tes anestésicos afectan la concentración de epinefrina del 
plasma, se seleccionaron 10 perros y se les midió la concen¬ 
tración cuando estaban bajo el influjo de isoflurano, halotano 
y ciclopropano anestésicos (“Sympathoadrenal and Hemody- 
namic Effects of Isoflurane, Halothane, and Cyclopropane 
in Dogs”, Anesthesiology, 1974: 465-470). Pruebe al nivel 
0.05 para ver si hay un efecto anestésico en concentración. 

Perro 



1 

2 

3 

4 

5 

Isoflurano 

0.28 

0.51 

LOO 

0.39 

0.29 

Halotano 

0.30 

0.39 

0.63 

0.38 

0.21 

Ciclopropano 

1.07 

1.35 

0.69 

0.28 

1.24 


6 

7 

8 

9 

10 

Isoflurano 

0.36 

0.32 

0.69 

0.17 

0.33 

Halotano 

0.88 

0.39 

0.51 

0.32 

0.42 

Ciclopropano 

1.53 

0.49 

0.56 

1.02 

0.30 


EJERCICIOS SUPLEMENTARIOS (28-36) 


28. El artículo “Effects of a Rice-Rich Versus Potato-Rich Diet 
on Glucose, Lipoprotein, and Cholesterol Metabolism in 
Noninsulin-Dependent Diabetics” (Amer. J. Clinical Nutr., 
1984: 598-606) da la información siguiente sobre la canti¬ 
dad de síntesis de colesterol para ocho sujetos diabéticos. 
A éstos se les alimentó con una dieta estandarizada con pa¬ 
pas o arroz como fuente principal de carbohidratos. Los parti¬ 
cipantes recibieron ambas dietas durante periodos 
especificados, con la cantidad de síntesis de colesterol 
(mmol/día) medida al final de cada periodo de dieta. El aná¬ 
lisis presentado en este artículo utilizó una prueba sin dis¬ 
tribución. Use el lector esta prueba con nivel de significación 
0.05 para determinar si la media verdadera de la cantidad de 
síntesis de colesterol difiere de modo importante para las 
dos fuentes de carbohidratos. 


Cantidad de síntesis de colesterol 


Sujeto 

1 

2 

3 

4 

5 

6 

7 

8 

Papas 

1.88 

2.60 

1.38 

4.41 

1.87 

2.89 

3.96 

2.31 

Arroz 

1.70 

3.84 

1.13 

4.97 

0.86 

1.93 

3.36 

2.15 


29. Las tácticas de venta de alta presión o los vendedores de 
puerta en puerta pueden ser muy agresivos. Numerosas per¬ 


sonas sucumben a esas tácticas, firman acuerdos de compra 
y posteriormente se lamentan de sus acciones. A mediados 
de la década de 1970, la Federal Trade Commission implan¬ 
tó reglamentos que aclaran y amplían los derechos de com¬ 
pradores para cancelar dichos acuerdos. La información 
siguiente es un subconjunto de la información dada en el 
artículo "Evaluating the FTC Cooling-Off Rule” ( J. Cortsu- 
mer Ajfaire, 1977: 101-106). Las observaciones individua¬ 
les son porcentajes de cancelación para cada uno de nueve 
vendedores durante cada uno de 4 años. Utilice una prueba 
apropiada al nivel 0.05 para ver si el promedio verdadero de 
la cantidad de cancelaciones depende del año. 


Vendedor 



1 

2 

3 

4 

5 

6 

7 

8 

9 

1973 

2.8 

5.9 

3.3 

4.4 

1.7 

3.8 

6.6 

3.1 

0.0 

1974 

3.6 

1.7 

5.1 

2.2 

2.1 

4.1 

4.7 

2.7 

1.3 

1975 

1.4 

0.9 

1.1 

3.2 

0.8 

1.5 

2.8 

1.4 

0.5 

1976 

2.0 

2.2 

0.9 

1.1 

0.5 

1.2 

1.4 

3.5 

1.2 


30. La información dada sobre la concentración de fósforo en 
tierra superficial, para cuatro tratamientos diferentes de sue¬ 
los, apareció en el artículo “Fertilisers for Lotus and Clover 
Establishment on a Sequence of Acid Soils on the East Otago 
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Uplands” (N. Zeal. J. Exper. Ag., 1984: 119-129). Utilice un 
procedimiento sin distribución para probar la hipótesis nula 
de no diferencia en la media verdadera de concentración de 
fósforo (mg/g) para los cuatro tratamientos de suelos. 


Tratamiento 


I 

8.1 

5.9 

7.0 

8.0 

9.0 

II 

11.5 

10.9 

12.1 

10.3 

11.9 

III 

15.3 

17.4 

16.4 

15.8 

16.0 

IV 

23.0 

33.0 

28.4 

24.6 

27.7 


31. Consulte la información del ejercicio 30 y calcule un interva¬ 
lo de confianza de 95% para la diferencia entre el promedio 
verdadero de concentraciones para los tratamientos II y III. 

32. El estudio publicado en “Gait Patterns During Free Choice 
Ladder Ascents” (Human Movement Sci., 1983: 187-195) 
fue motivado por publicidad relativa al mayor porcentaje 
de accidentes para individuos que suben por escaleras. De 
acuerdo con instrucciones especificadas se utilizaron varias 
formas diferentes de pasos por personas que trepaban por 
una escalera recta portátil. Se dan tiempos de ascenso para 
siete sujetos que usaron un paso lateral y seis sujetos que 
usaron un paso diagonal de cuatro tiempos. 

Lateral 0.86 1.31 1.64 1.51 1.53 1.39 1.09 

Diagonal 1.27 1.82 1.66 0.85 1.45 1.24 

a. Realice una prueba usando a = 0.05 para ver si la infor¬ 
mación sugiere cualquier diferencia en el promedio ver¬ 
dadero de tiempos de ascenso para los dos pasos. 

b. Calcule un intervalo de confianza de 95% para la dife¬ 
rencia entre el promedio verdadero de tiempos de paso. 

33. La prueba de signo es un procedimiento muy sencillo pa¬ 
ra probar hipótesis acerca de una mediana poblacional que 
supone sólo que la distribución fundamental es continua. 
Para ilustrar, considere la siguiente muestra de 20 observa¬ 
ciones sobre la vida útil de un componente (h): 


1.7 

3.3 

5.1 

6.9 

12.6 

14.4 

16.4 

24.6 

26.0 

26.5 

32.1 

37.4 

40.1 

40.5 

41.5 

72.4 

80.1 

86.4 

87.5 

100.2 


Se desea 

probar 

H 0 : p 

= 25.0 en 

función de // a : p 

> 25.0. 


El estadístico de prueba es Y = el número de observaciones 
que exceden de 25. 

a. Considere rechazar H 0 si Y S 15. ¿Cuál es el valor de a 
(la probabilidad de un error tipo I) para esta prueba? 
[Sugerencia: Considere un “éxito” como una vida útil 
que exceda de 25.0. Entonces Y es el número de éxitos 
de la muestra.] ¿Qué clase de distribución tiene Y cuan¬ 
do p = 25.0? 

b. ¿Qué región de rechazo de la forma fie especifica una 
prueba con un nivel de significación tan cercano a 0.05 
como sea posible? Utilice esta región para efectuar la 
prueba para la información dada. 

[Nota: El estadístico de prueba es el número de diferencias 
X¡ — 25 que tiene signos positivos, por ello el nombre de 
prueba de signo.] 

34. Consulte el ejercicio 33 y considere un intervalo de confian¬ 
za asociado con la prueba de signo, el intervalo de signo. 
Las hipótesis relevantes son ahora H 0 : p = jl 0 contra 


Ejercicios suplementarios 623 


// a : p A p 0 . Úsese la siguiente región de rechazo: f £ 15 o 
5. 

a. ¿Cuál es el nivel de significación para esta prueba? 

b. El intervalo de confianza constará de todos los valores 
p 0 para los cuales H 0 no es rechazada. Determine el in¬ 
tervalo de confianza para la información dada y exprese 
el nivel de confianza. 

35. Suponga que desea probar 

H 0 : las distribuciones X y Y son idénticas 
contra 

la distribución x está menos dispersa que 
la distribución Y 


La figura siguiente presenta distribuciones X y Y para las 
que 7/ a es verdadera. La prueba Wilcoxon de prueba de ran¬ 
gos no es apropiada en esta situación porque cuando /7 a es 
verdadera como se ilustra, las Y tenderán a estar en los ex¬ 
tremos máximos de la muestra combinada (lo que da por re¬ 
sultado rangos pequeños y grandes de Y), de modo que la 
suma de los rangos de X dará por resultado un valor W que 
no es ni grande ni pequeño. 



“Rangos”! 1 3 5 • • • 6 4 2 

Considere modificar el procedimiento para asignar rangos 
como sigue: Después de ordenar la muestra combinada de 
m + n observaciones, la observación más pequeña recibe 
un rango 1, la observación más grande recibe un rango 2, la 
segunda más pequeña recibe rango 3, la segunda más gran¬ 
de recibe rango 4 y así sucesivamente. Entonces, si W a es 
verdadera como se ilustra, los valores X tenderán a estar en 
la parte media de la muestra y en esa forma reciben rangos 
grandes. Denote con W' la suma de los rangos X y conside¬ 
re rechazar H 0 a favor de H ñ cuando w' a c. Cuando H 0 es 
verdadera, todo posible conjunto de rangos de X tiene la 
misma probabilidad, de modo que W' tiene la misma distri¬ 
bución que W cuando H 0 es verdadera. Entonces, c se pue¬ 
de seleccionar de la tabla A. 14 del apéndice para dar una 
prueba de nivel a. La información siguiente se refiere al gro¬ 
sor muscular intermedio, para arteriolas de pulmones de ni¬ 
ños que murieron de síndrome de muerte infantil repentina 
(x) (SIDS, por sus siglas en inglés) y un grupo de niños de 
control (y). Efectúe la prueba de H 0 contra H á al nivel 0.05. 

SIDS 4.0 4.4 4.8 4.9 

Control 3.7 4.1 4.3 5.1 5.6 

Consulte el libro Lehmann (en el capítulo de bibliografía) 
para más información en esta prueba llamada prueba de 
Siegel-Tukey. 

36. El procedimiento para ordenar que se describe en el ejerci¬ 
cio 35 es asimétrico en ocasiones, porque la observación 
más pequeña recibe un rango 1 mientras que la más gran¬ 
de recibe rango 2 y así sucesivamente. Suponga que la más 
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pequeña y la más grande reciben rango 1, la segunda más pe¬ 
queña y la segunda más grande reciben rango 2, y así sucesi¬ 
vamente, y sea W" la suma de los rangos X. La distribución 
nula de W" no es idéntica a la distribución nula de W, de 
modo que se hacen necesarias tablas diferentes. Considere 
el caso m = 3, n = 4. Haga una lista de los 35 posibles or¬ 
denamientos de los tres valores X entre las siete observacio¬ 


nes (por ejemplo, 1, 3, 7 o 4, 5, 6), asigne rangos en la for¬ 
ma descrita, calcule el valor de W" para cada posibilidad, y 
a continuación tabule la distribución nula de W". Para la 
prueba que rechaza si w" £: c, ¿qué valor de c prescribe 
aproximadamente una prueba de nivel 0.10? Ésta es la prue¬ 
ba Ansari-Bradley, para información adicional, vea el libro 
de Hollander and Wolfe en la bibliografía del capítulo. 
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16 


Métodos de control 
de calidad 


INTRODUCCION 

Las características de calidad de productos manufacturados han recibido considera¬ 
ble atención por parte de ingenieros de diseño y personal de producción, así como 
de quienes se ocupan de la administración financiera. Un artículo de fe por muchos 
años fue que los muy elevados niveles de calidad y bienestar económico eran metas 
comparables, pero recientemente se ha hecho cada vez más evidente que elevar los 
niveles de calidad puede llevar a reducir costos y a un mayor grado de satisfacción 
del consumidor, con lo cual aumenta la rentabilidad. Esto ha dado por resultado un 
renovado énfasis en técnicas estadísticas para diseñar calidad en productos y para 
identificar problemas de calidad en diversas etapas de producción y distribución. 

Las gráficas de control tienen ahora un amplio uso en la industria como técni¬ 
ca de vigilancia de procesos de producción, para identificar inestabilidad y circuns¬ 
tancias poco comunes. Después de una introducción a las ideas básicas en la sección 
16.1, en las siguientes cuatro secciones se presentan diversas gráficas de control. La 
base para casi todas éstas se encuentra en el trabajo previo, referente a distribucio¬ 
nes de probabilidad de varios estadísticos, como por ejemplo la media muestral Xy 
la proporción muestral p = X/n. 

Otra situación, que por lo general se encuentra en la industria, es una decisión 
tomada por un cliente en cuanto a si un lote de piezas ofrecidas por un proveedor 
es de calidad aceptable. En la última sección del capítulo se examinan brevemente 
algunos métodos de muestreo de aceptación para decidir, con base en datos mués¬ 
trales, sobre la disposición de un lote. 

Además de gráficas de control y planes de muestreo de aceptación, que primero 
se desarrollaron en las décadas de 1920 y 1930, expertos en estadística e ingenieros 
han introducido recientemente numerosos métodos estadísticos para identificar tipos 
y niveles de entradas de producción que aseguran una producción de alta calidad. 
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626 CAPITULO 16 Métodos de control de calidad 


Investigadores japoneses, y en particular el ingeniero y estadístico G. Taguchi y sus dis¬ 
cípulos, han tenido gran influencia en este sentido; ahora hay una gran cantidad de 
información conocida como "métodos Taguchi". Las ¡deas de diseño experimental, y 
en particular experimentos de factores fraccionarios, son ingredientes clave. Todavía 
hay mucha controversia en la comunidad estadística en cuanto a cuáles diseños y mé¬ 
todos de análisis son más apropiados para el trabajo a ejecutar. Una crítica reciente es¬ 
tá contenida en el artículo de George Box y otros, citado en la bibliografía de este 
capítulo; el libro de Thomas Ryan citado aquí es también una buena fuente de in¬ 
formación. 


16.1 Comentarios generales 



control 


Un mensaje esencial en todo este libro ha sido la capacidad de penetración de la variación 
que ocurre de manera natural, asociada con cualquier característica o atributo de individuos 
u objetos diferentes. En un contexto de manufacturas, no importa lo cuidadosamente que se 
hayan calibrado las máquinas, que se controlen los factores ambientales, se supervisen ma¬ 
teriales y otros insumos, y se capaciten trabajadores, el diámetro variará de un tornillo a 
otro, algunas hojas de plástico serán más fuertes que otras, algunos fusibles serán defectuo¬ 
sos y otros no tendrán problemas, y así sucesivamente. Se podría considerar que estas va¬ 
riaciones aleatorias naturales son ruido de fondo incontrolable. 

Son, no obstante, otras fuentes de variación las que pueden tener un impacto pernicio¬ 
so en la calidad de piezas producidas por algún proceso. Esta variación puede ser atribuible 
a material contaminado, ajustes incorrectos de máquinas, desgaste poco común en herra¬ 
mientas, y otros semejantes. Estas fuentes de variación se han denominado causas asigna¬ 
bles en la literatura de control de calidad. Las gráficas de control son un mecanismo para 
reconocer situaciones donde las causas asignables pueden estar afectando de manera adver¬ 
sa la calidad de un producto. Una vez que la gráfica indique una situación fuera de control, 
puede iniciarse una investigación para identificar causas y tomar medidas correctivas. 

Un elemento básico de las gráficas de control es que las muestras se hayan seleccio¬ 
nado del proceso de interés en una secuencia de tiempos. Dependiendo del aspecto del pro¬ 
ceso bajo investigación, se selecciona algún estadístico, por ejemplo la media muestral o la 
proporción muestral de los artículos defectuosos. El valor de este estadístico se calcula en¬ 
tonces para cada muestra en su turno. El resultado entonces es una gráfica de control tradi¬ 
cional al localizar estos valores calculados en el tiempo, como se ilustra en la figura 16.1. 


Valor del estadístico 
de calidad 


LSC = Límite superior de control 


Línea 
de centro 


LIC = Límite inferior de control 


Tiempo 


2 3 4 5 . . . 


Figura 16.1 Prototipo de gráfica de control. 
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16.2 Gráficas de control para ubicación de proceso 627 

Nótese que además de los puntos localizados, la gráfica tiene una línea de centro y dos 
límites de control. La base para la selección de una línea de centro es a veces un valor ob¬ 
jetivo o especificación de diseño, por ejemplo, un valor deseado del diámetro de cojinetes. 
En otros casos, la altura de la línea de centro se estima a partir de la información. Si los pun¬ 
tos de la gráfica están todos entre los dos límites de control, se considera que el proceso 
está bajo control. Esto es, se piensa que el proceso está operando de un modo estable que 
refleja sólo una variación aleatoria natural. Una “señal” fuera de control se presenta siem¬ 
pre que los puntos localizados caigan fuera de los límites, lo cual se supone atribuible a al¬ 
guna causa asignable y se inicia una búsqueda de esa causa. Los límites están diseñados de 
modo que un proceso bajo control genera muy pocas alarmas falsas, mientras que un pro¬ 
ceso fuera de control rápidamente da lugar a un punto fuera de los límites. 

Hay una fuerte analogía entre la lógica de una gráfica de control y el trabajo previo 
de pruebas de hipótesis. La hipótesis nula aquí es que el proceso está bajo control. Cuando 
un proceso bajo control da un punto fuera de los límites de control (una señal fuera de con¬ 
trol), ha ocurrido un error tipo I. Por otra parte, un error tipo II ocurre cuando un proceso 
fuera de control produce un punto dentro de los límites de control. La apropiada selección 
de tamaño muestral y límites de control (estos últimos correspondientes a especificar una 
región de rechazo en la prueba de hipótesis) hará que las probabilidades de error asociadas 
sean adecuadamente pequeñas. 

Hay que destacar que “bajo control” no es sinónimo de “satisface especificaciones o 
tolerancia de diseño”. La magnitud de una variación natural puede ser tal que el porcentaje 
de piezas que no se apegan a especificaciones sea mucho mayor de lo que se pueda tolerar. 
En tales casos, puede ser necesaria una reestructuración importante del proceso para mejo¬ 
rar la capacidad del proceso. Un proceso bajo control es simplemente aquel cuyo compor¬ 
tamiento con respecto a la variación es estable en el tiempo, sin mostrar indicaciones de 
causas extrañas poco comunes. 

Como comentario final de introducción, ahora es fácil adquirir software para elaborar 
gráficas de control. La revista Quality Progress contiene numerosos anuncios de paquetes 
de control estadístico de calidad. Además, SAS y la versión más reciente de MINITAB, en¬ 
tre otros paquetes de uso general, tienen atractivas capacidades de control de calidad. 


EJERCICIOS Sección 16.1 (1-3) 


1. Una gráfica de control para el grosor de láminas de acero la¬ 
minado está basada en un límite superior de control de 0.0520 
pulgadas y un límite inferior de 0.0475 pulgadas. Si los pri¬ 
meros diez valores del estadístico de control (en este caso X , 
el grueso medio muestral de n = 5 láminas de muestra) son 
0.0506, 0.0493, 0.0502, 0.0501, 0.0512, 0.0498, 0.0485, 
0.0500, 0.0505 y 0.0483. Construya la parte inicial de la grá¬ 
fica de control de calidad y comente sobre su aspecto. 

2. Consulte el ejercicio 1 y suponga que los diez valores más re¬ 
cientes del estadístico de control son 0.0493, 0.0485, 0.0490, 
0.0503, 0.0492, 0.0486, 0.0495, 0.0494, 0.0493 y 0.0488. 
Construya la parte relevante de la correspondiente gráfica de 
control y comente sobre su aspecto. 


3. Suponga que se construye una gráfica de control de modo que 
la probabilidad de un punto que cae fuera de los límites de con¬ 
trol, cuando el proceso está realmente bajo control, es 0.002. 
¿Cuál es la probabilidad de que diez puntos sucesivos (con ba¬ 
se en muestras seleccionadas de manera independiente) estén 
dentro de los límites de control? ¿Cuál es la probabilidad de 
que 25 puntos sucesivos caigan todos dentro de los límites 
de control? ¿Cuál es el número más pequeño de puntos sucesi¬ 
vos graficados, para el que la probabilidad de observar al me¬ 
nos uno fuera de los límites de control exceda de 0.10? 


16.2 Gráficas de control para ubicación de proceso 


Suponga que la característica de calidad de interés está asociada con una variable cuyos va¬ 
lores observados resultan de tomar mediciones. Por ejemplo, la característica podría ser la 
resistencia de un alambre eléctrico (ohms), el diámetro interno de juntas de expansión de 
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caucho moldeado (cm) o dureza de cierta aleación (unidades Brinell). Un uso importante de 
gráficas de control es ver si alguna medida de ubicación de la distribución de la variable per¬ 
manece estable en el tiempo. La gráfica más popular para este fin es la X. 

La gráfica X basada en valores conocidos 
de parámetros 

Debido a que hay incertidumbre acerca del valor de la variable para cualquier pieza o espé¬ 
cimen particular, por X se denota una variable aleatoria (ya, rv por sus siglas en inglés). Su¬ 
ponga que para un proceso bajo control, X tiene una distribución normal valor medio ¡x 
y desviación estándar cr. Entonces, si X denota la media muestral para una muestra aleato¬ 
ria de tamaño n seleccionada en un punto de tiempo particular, se sabe que 

1. E(X) = ¡jl 

2 . cr * = crl\fn 

3. X tiene una distribución normal. 

Se deduce que 

P(ju. - 3o-* < X < ¡x + 3o-*) = P(-3.00 < Z < 3.00) = 0.9974 

donde Z es una variable aleatoria normal estándar.* Es entonces muy probable que para un 
proceso bajo control, la media muestral caerá dentro de 3 desviaciones estándar para (3o - *) 
de la media ¡x del proceso. 

Considere primero el caso en el que se conocen los valores de /x y cr. Suponga que en 
cada uno de los puntos de tiempo 1, 2, 3,..., existe una muestra aleatoria de tamaño n. De¬ 
note con jCj, x 2 , . los valores calculados de las medias muéstrales correspondientes. 

Resulta una gráfica X de localizar estas x¡ en el tiempo, es decir, localizar los puntos (1, x,), 
(2, x 2 ), (3, x 3 ) y así sucesivamente, y luego trazar rectas horizontales de un lado a otro de la 
gráfica en 


LIC = límite inferior de control = 


cr 



LSC = límite superior de control 



Este trazado se llama con frecuencia gráfica de 3 sigmas. Cualquier punto fuera de los lími¬ 
tes de control sugiere que el proceso pueda haber estado fuera de control en ese tiempo, de 
modo que debe iniciarse una búsqueda de las causas asignables. 


Ejemplo 16.1 Una vez al día, se seleccionan tres especímenes de aceite de motor del proceso de produc¬ 
ción y cada uno se analiza para determinar su viscosidad. La información siguiente (tabla 
16.1) es para un periodo de 25 días. Una amplia experiencia con este proceso sugiere que 
cuando el proceso está bajo control, la viscosidad de un espécimen está normalmente distri¬ 
buida con media 10.5 y desviación estándar 0.18. Entonces cr* = cr/Vñ” = 0.1S/V3~ = 
0.104, de modo que los límites de control de 3 desviaciones estándar son 

LIC = ¡X - 3 • -4= = 10.5 - 3(0.104) = 10.188 

V n 

LSC = ¡x + 3 • = 10.5 + 3(0.104) = 10.812 

V n 


El uso de gráficas basadas en 3 límites de desviación estándar es tradicional, pero la tradición ciertamente no es 
inviolable. 
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Tabla 16.1 Información de viscosidad para el ejemplo 16.1 


Día 

Observaciones de viscosidad 

X 

s 

Rango 

1 

10.37 

10.19 

10.36 

10.307 

0.101 

0.18 

2 

10.48 

10.24 

10.58 

10.433 

0.175 

0.34 

3 

10.77 

10.22 

10.54 

10.510 

0.276 

0.55 

4 

10.47 

10.26 

10.31 

10.347 

0.110 

0.21 

5 

10.84 

10.75 

10.53 

10.707 

0.159 

0.31 

6 

10.48 

10.53 

10.50 

10.503 

0.025 

0.05 

7 

10.41 

10.52 

10.46 

10.463 

0.055 

0.11 

8 

10.40 

10.38 

10.69 

10.490 

0.173 

0.31 

9 

10.33 

10.35 

10.49 

10.390 

0.087 

0.16 

10 

10.73 

10.45 

10.30 

10.493 

0.218 

0.43 

11 

10.41 

10.68 

10.25 

10.447 

0.217 

0.43 

12 

10.00 

10.60 

10.71 

10.437 

0.382 

0.71 

13 

10.37 

10.50 

10.34 

10.403 

0.085 

0.16 

14 

10.47 

10.60 

10.75 

10.607 

0.140 

0.28 

15 

10.46 

10.46 

10.56 

10.493 

0.058 

0.10 

16 

10.44 

10.68 

10.32 

10.480 

0.183 

0.36 

17 

10.65 

10.42 

10.26 

10.443 

0.196 

0.39 

18 

10.73 

10.72 

10.83 

10.760 

0.061 

0.11 

19 

10.39 

10.75 

10.27 

10.470 

0.250 

0.48 

20 

10.59 

10.23 

10.35 

10.390 

0.183 

0.36 

21 

10.47 

10.67 

10.64 

10.593 

0.108 

0.20 

22 

10.40 

10.55 

10.38 

10.443 

0.093 

0.17 

23 

10.24 

10.71 

10.27 

10.407 

0.263 

0.47 

24 

10.37 

10.69 

10.40 

10.487 

0.177 

0.32 

25 

10.46 

10.35 

10.37 

10.393 

0.059 

0.11 


Todos los puntos de la gráfica de control mostrados en la figura 16.2 están entre los límites 
de control, lo que indica comportamiento estable de la media del proceso en el periodo 
(la desviación estándar y rango para cada muestra se usarán en la subsección siguiente). 



_ 


10.85 


Límite superior de control 


• 

• 

10.50 


• 

• 

- 

- • 

• • • • • • • 

• • w 

Límite inferior de control 

10.15 



5 

10 15 20 25 


Tiempo 


Figura 16.2 


Gráfica X para la información de viscosidad del ejemplo 16.1. 


Gráficas X basadas en parámetros estimados 

En la práctica ocurre con frecuencia que se desconocen valores de ¡x y o\ de modo que de¬ 
ben estimarse a partir de datos muéstrales antes de determinar los límites de control. Esto 
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es especialmente cierto cuando un proceso se somete primero a un análisis de control de ca¬ 
lidad. Otra vez denote por n el número de observaciones de cada muestra y represente con k 
el número de muestras que haya. Los valores típicos de n son 3, 4, 5 o 6 y se recomienda 
que k sea al menos 20. Se supone que las k muestras se reunieron durante un periodo cuan¬ 
do se pensaba que el proceso estaba bajo control. En breve se analizará más esta suposición. 

Con X,, x 2 ,... ,x k denotando las k medias muéstrales calculadas, la estimación común 
de ¡x es simplemente el promedio de estas medias: 

k 

X*, 

i=i 

tx=x= — 

Se presentan dos métodos diferentes que por lo común se usan para estimar cr, uno de ellos 
basado en las k desviaciones muéstrales estándar y el otro en los k rangos muéstrales (re¬ 
cuerde que el rango muestral es la diferencia entre las observaciones muéstrales más gran¬ 
des y las más pequeñas). Antes de la generalizada disponibilidad de buenas calculadoras y 
software computarizado de estadística, la facilidad de hacer cálculos manualmente era una 
consideración de extrema importancia, de modo que predominaba el método del rango. No 
obstante, en el caso de una distribución normal de población, se sabe que el estimador in¬ 
sesgado de cr basado en S tiene una varianza más pequeña que el basado en el rango mues¬ 
tral. Los expertos en estadística dicen que el primer estimador es más eficiente que el último. 
La pérdida de eficiencia para el estimador es ligera cuando n es muy pequeña pero se hace 
importante cuando n > 4. 

Recuerde que la desviación estándar muestral no es un estimador insesgado para cr. 
Cuando X u . . . , X n es una muestra aleatoria de una distribución normal, se puede demos¬ 
trar (ejercicio 6.37) que 




E(S) = a n - a 

donde 

_ V2r(n/2) 

a " ~ V« - Tr[(n - l)/ 2 ] 

y r(-) denota la función gama (vea la sección 4.4). A continuación aparece una tabulación 
de a n para la n seleccionada: 


n 

3 

4 

5 

6 

7 

8 

a n 

0.886 

0.921 

0.940 

0.952 

0.959 

0.965 


Sea 

k 

Xs, 

s = —-— 

k 


donde ,Sj, S 2 , ■ ■ ■ , S k son las desviaciones muéstrales para las k muestras. Entonces 


E(S) 


fiíts. 


i= 1 


De este modo 


! ‘ 1 k 

y X E(S¡) = a n - cr = a n • a 
k i=\ k i=l 



—E(S ) 
a„ 


1 

- a • a = a 

«„ 


O 


de modo que cf = S/a n es un estimador insesgado de cr. 
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Límites de control basados en las desviaciones muéstrales estándar 

LIC = 3c - 3 • 

s 

a„Vn 

LSC = x + 3 

s 

a n Vn 

donde 


k 

I* 

x ~ k s ~ 

k 

¿=1 

k 


Si se consulta la información de viscosidad del ejemplo 16.1, tenía n = 3 y k = 25. Los va¬ 
lores de x¡ y s¡ (i = 1, . . . , 25) aparecen en la tabla 16.1, de lo cual se deduce que x = 
261.896/25 = 10.476 ys = 3.834/25 = 0.153. Con a 3 = 0.886, se tiene 

LIC = 10.476 - 3 • - - 0 - 153 - = 10.476 - 0.299 = 10.177 
0.886V3 

LSC = 10.476 + 3 • - °- 153 ^ = 10.476 + 0.299 = 10.775 
0.886V3 

Estos límites difieren un poco de los límites previos basados en ¡i = 10.5 y cr = 0.18 por¬ 
que ahora /i = 10.476 y cr = s/a 3 = 0.173. Una inspección de la tabla 16.1 muestra que to¬ 
da x¡ está entre estos nuevos límites, de manera que de nueva cuenta no está evidente una 
situación fuera de control ■ 


Para obtener una estimación de cr basada en el rango muestral, note que si X h ..., X n 
forman una muestra aleatoria de una distribución normal, entonces 


R = rango(Xj, . . . , X n ) 

= máx(X,, . . . , X n ) - míníAj, . . . , X n ) 

= máx(Aj — ¡i,... ,X n — ¡x) — mín/A", — n, ... ,X n — fi) 


= cr] max 


X, 




x n ~v \ 


— mín 


— t 

<j 


= o- • {máx(Zj, . . . , Z„) - mín(Z,, . . . , Z n )} 



donde Z,, . . . , Z n son variables aleatorias normales estándar independientes. Entonces 
E(R ) = cr • //(rango de una muestra normal estándar) 

= o--b n 

de modo que R/b n es un estimador insesgado de cr. 

Ahora denote con r h r 2 , ... ,r k los rangos para las k muestras del conjunto de infor¬ 
mación de control de calidad. El argumento que se acaba de dar implica que la estimación 

I k 

\Zr, _ 

b. ~ b. 



proviene de un estimador insesgado para cr. Los valores seleccionados de b n aparecen en la 
tabla siguiente [su cálculo está basado en el uso de teoría estadística e integración numéri¬ 
ca para determinar £'(mín(Z 1 , . . . , ZJ) y £(máx(Zj, . . . , Z n ))\. 






























CAPÍTULO 16 


Métodos de control de calidad 


Ejemplo 16.3 

(Continúa del 
ejemplo 16.2) 


n 

3 

4 

5 

6 

7 

8 

b n 

1.693 

2.058 

2.325 

2.536 

2.706 

2.844 


Límites de control basados en los rangos muéstrales 


LIC 

LSC 


r 



donde r = 2 r¡/k y r v . . . , r k son los k rangos muéstrales individuales. 


De la tabla 16.1 puede verificarse fácilmente que r = 0.292, de modo que cr = 0.292/¿> 3 = 
0.292/1.693 = 0.172 y 


0 292 

LIC = 10.476 - 3 • - - = 10.476 - 0.299 = 10.177 

1.693V3 

0 292 

LSC = 10.476 + 3 • ■ - > = 10.476 + 0.299 = 10.775 

1.693V3 

Estos límites son idénticos a los basados en 5 y de nuevo toda x¡ se encuentra entre límites. 


Recálculo de los límites de control 

Se ha supuesto que la información muestral empleada para estimar ¡i y cr se obtuvo de un 
proceso bajo control, pero suponga que uno de los puntos de la gráfica de control resultan¬ 
te cae fuera de los límites de control. Entonces, si se puede hallar y verificar una causa asig¬ 
nable para esta situación fuera de control, se recomienda que los nuevos límites de control 
se calculen después de borrar la muestra correspondiente del conjunto de información. Del 
mismo modo, si más de un punto cae fuera de los límites originales, deben determinarse 
nuevos límites después de eliminar cualquier punto para el que una causa asignable pueda 
identificarse y resolverse. Incluso puede ocurrir que uno o más puntos caigan fuera de los 
nuevos límites, en cuyo caso el proceso de borrar y recalcular debe repetirse. 

Características de operación de gráficas de control 

En términos generales, una gráfica de control será efectiva si da muy pocas señales fuera de 
control cuando el proceso está bajo control, pero muestra un punto fuera de los límites 
de control casi tan pronto como el proceso se salga de control. Una evaluación de la efecti¬ 
vidad de una gráfica está basada en la noción de “probabilidades de error”. Suponga que la 
variable de interés está distribuida normalmente con cr conocida (el mismo valor para un 
proceso bajo control o fuera de control). Además, considere una gráfica de 3 sigmas basada 
en el valor objetivo p, 0 , con p, = p„ cuando el proceso está bajo control. Una probabilidad 
de error es 
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16.2 Gráficas de control para ubicación de proceso 633 
a = P(una sola muestra da un punto fuera de los límites de control cuando /a = \ u, 0 ) 

= P(X > ¡jl q + 3rr/ V / 7j o X < ¡jl 0 — 3dl\/n cuando p, = ¡jl 0 ) 

JX ~ Po . o X - /i 0 „ „ , \ 

' W > 3 0 7MT " " 3 cuand0 <* = “"j 

La variable estandarizada Z = {X — ii 0 )/(cr/\/ñ ) tiene una distribución normal estándar 
cuando /u = /i 0 , de modo que 

a = P(Z > 3 o Z < -3) = $(-3.00) + 1 - $(3.00) = 0.0026 

Si se ha usado 3.09 en lugar de 3 para determinar los límites de control (esto se acostumbra 
en la Gran Bretaña), entonces 

a = P(Z > 3.09 o Z < -3.09) = 0.0020 

El uso de límites de 3 sigmas hace muy poco probable que resulte una señal fuera de con¬ 
trol de un proceso bajo control. 

Ahora suponga que el proceso está fuera de control porque ¡jl ha cambiado a /i + Acr 
(A puede ser positiva o negativa); A es el número de desviaciones estándar en los que ¡jl ha 
cambiado. Una segunda probabilidad de error es 

/una sola muestra da un punto dentro de los 
^ M límites de control cuando p, = fi n + Acr 

= P(¡¿ 0 — 3cr/X^ñ < X < / r 0 + 3cr/Vñ cuando ¡jl = ¡jl 0 + Acr) 

Ahora se estandariza al restar primero /x 0 + Acr de cada término que está dentro de los pa¬ 
réntesis y a continuación dividir entre cr Vñ. Esto da 

/3 = P (—3 — V/íA < variable aleatoria normal estándar < 3 — VhA) 

= $(3 - VñA) - $(-3 - VñA) 

Esta probabilidad de error depende de A, que determina el tamaño del cambio y del tama¬ 
ño muestral rt. En particular, para A fija, /3 disminuirá cuando n aumente (cuanto más gran¬ 
de sea el tamaño muestral, es más probable que resulte una señal fuera de control), y para n 
fija, ¡3 disminuye cuando | A | aumenta (cuanto mayor sea la magnitud del cambio, es más 
probable que resulte una señal fuera de control). La tabla siguiente da /3 para valores selec¬ 
cionados de A cuando n = 4. 


A 

0.25 

0.50 

0.75 

1.00 

1.50 

2.00 

2.50 

3.00 

cuando n — 4 

0.9936 

0.9772 

0.9332 

0.8413 

0.5000 

0.1587 

0.0668 

0.0013 



Es evidente que es muy poco probable que un pequeño cambio pase sin ser detectado en una 
muestra individual. 

Si 3 es sustituido por 3.09 en los límites de control, entonces a disminuye de 0.0026 
a 0.002, pero para cualesquier n y cr fijas, ¡3 aumentará. Esto es sólo una manifestación de 
la relación inversa entre los dos tipos de probabilidades de error al probar hipótesis. Por 
ejemplo, cambiar 3 a 2.5 aumentará a y disminuirá [3. 

Las probabilidades de error examinadas hasta aquí se calculan bajo la suposición 
de que la variable de interés está distribuida de manera normal. Si la distribución es sólo li¬ 
geramente no normal, el efecto del Teorema de Límite Central implica que X tendrá de un mo¬ 
do aproximado una distribución normal incluso cuando n sea pequeña, en cuyo caso las 
probabilidades de error indicadas serán casi correctas. Este, por supuesto, ya no es el caso 
cuando la distribución de la variable se desvía considerablemente de la normalidad. 
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Una segunda evaluación del uso comprende la dimensión esperada o promedio de lo¬ 
te, necesaria para observar una señal fuera de control. Cuando el proceso está bajo control, 
se debería esperar observar muchas muestras antes de ver una cuya x se encuentre fuera de 
los límites de control. Por otra parte, si un proceso se sale de control, el número esperado 
de muestras necesario para detectar esto debe ser pequeño. 

Denote con p la probabilidad de que una sola muestra dé un valor x fuera de los lími¬ 
tes de control, es decir, 

p = P(X < /i 0 — 3(r/\/ñ o X > jju t) + 3(j/Vn) 

Considere primero un proceso bajo control, de modo que Aj, X 2 , X 3 ,. . . están todas normal¬ 
mente distribuidas con valor medio ¡x 0 y desviación estándar ct/\/h. Defina una variable 
aleatoria Y por 

Y = la primera i para la que X i cae fuera de los límites de control 

Si se considera cada número muestral como un intento y una muestra fuera de control co¬ 
mo un éxito, entonces Y es el número de intentos (independientes) necesarios para observar 
un éxito. Esta Y tiene una distribución geométrica, como se demostró en el ejemplo 3.18 que 
E(Y) = 1/p. El acrónimo ARL (por sus siglas en inglés o magnitud promedio de lote) se usa 
con frecuencia en lugar de E(Y). Como p = a para un proceso bajo control, se tiene 


ARL = E(Y) = - = — 
p a 


_J_ _ 

0.0026 


384.62 


Al sustituir 3 en los límites de control con 3.09, resulta ARL = 1/0.002 = 500. 

Ahora suponga que, en un punto particular de tiempo, la media del proceso cambia 
a jU = p, 0 + Acr. Si se define Y como la primera i subsiguiente al cambio para el que una 
muestra genera una señal fuera de control, de nuevo es cierto que ARL = E(Y) = 1/p, pero 
ahora p = 1 — j3. La tabla siguiente da las ARL para una gráfica de 3 sigmas cuando n = 4. 
Estos resultados nuevamente demuestran la efectividad de la gráfica para detectar cambios 
grandes pero también su incapacidad de identificar con rapidez cambios pequeños. Cuando 
el muestreo se hace con poca frecuencia, es probable que muchas piezas se produzcan an¬ 
tes que un pequeño cambio en /j, sea detectado. Los procedimientos CUSUM examinados 
en la sección 16.5 se crearon para manejar esta deficiencia. 



A 

0.25 

0.50 

0.75 

LOO 

1.50 

2.00 

2.50 

3.00 

ARL cuando n = 4 

156.25 

43.86 

14.97 

6.30 

2.00 

1.19 

1.07 

1.0013 


Reglas suplementarias para gráficas X 

La incapacidad de gráficas X con límites de 3 sigmas, para detectar con rapidez cambios pe¬ 
queños en la media de un proceso, ha impulsado a investigadores a crear procesos que den 
un mejor comportamiento en este respecto. Un método consiste en la introducción de con¬ 
diciones adicionales que hacen que se genere una señal fuera de control. Las siguientes condi¬ 
ciones fueron recomendadas por Western Electric (entonces subsidiaria de AT&T). Una 
intervención para tomar medidas correctivas es apropiada siempre que se satisfaga una de 
estas condiciones: 

1. Dos de cada tres puntos sucesivos caigan fuera de los límites de 2 sigmas en el mismo 
lado de la línea de centro. 

2. Cuatro de cada cinco puntos sucesivos caigan fuera de los límites de 1 sigma en el mis¬ 
mo lado de la línea de centro. 

3. Ocho puntos sucesivos caigan fuera en el mismo lado de la línea de centro. 
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Debe consultarse un texto sobre control de calidad para ver una discusión de éstas y otras 
reglas suplementarias. En la sección 16.5 se presenta un tipo diferente de procedimiento pa¬ 
ra superar la deficiencia de la gráfica X. 

Gráficas de control robustas 

La presencia de valores aislados en la información de la muestra tiende a reducir la sensibi¬ 
lidad de procedimientos de gráficas de control cuando deban estimarse parámetros. Esto es 
porque los límites de control se mueven hacia fuera desde la línea de centro, lo cual hace 
más difícil la identificación de puntos poco comunes. No es deseable que el estadístico 
cuyos valores se dibujen sea resistente a valores aislados, porque esto ocultaría cualquier se¬ 
ñal fuera de control. Por ejemplo, dibujar medias muéstrales sería menos eficaz que trazar 
3c lt x 2 , . . . como se hace en una gráfica X. 

El artículo “Robust Control Charts” de David M. Rocke ( Technometrics, 1989: 173- 
184) presenta un estudio de procedimientos para los que los límites de control están basa¬ 
dos en estadísticos resistentes a los efectos de valores aislados. Rocke recomienda límites 
de control calculados del rango intercuartil (IQR), que es muy semejante a la cuarta disper¬ 
sión introducida en el capítulo 1. En particular, 

f (2a. x¡ más grande) — (2a. x¡ más pequeña) n = 4, 5, 6, 7 
j (3a. x¡ más grande) — (3a. x¡ más pequeña) n = 8, 9, 10, 11 



Para una muestra aleatoria de una distribución normal, £'(IQR)= k n a: los valores de k n se 
dan en la tabla siguiente: 


n 

4 

5 

6 

7 

8 

K 

0.596 

0.990 

1.282 

1.512 

0.942 


Los límites de control sugeridos son 


LIC = 3t - 3 • 


IQR 

k n V7i 


LSC 


x + 3 • 


IQR 

KVn 


Los valores de x¡, x 2 , x 3 , . . . se dibujan. Las simulaciones publicadas en el artículo indica¬ 
ron que el uso de la gráfica con estos límites es superior al de la gráfica X tradicional. 


O 


EJERCICIOS Sección 16.2 (4-13) 


4 . En el caso de p y a conocidas, ¿qué límites de control son 
necesarios para la que sea 0.005 la probabilidad de un solo 
punto que esté fuera de los límites para un proceso bajo 
control? 

5 . Considere una gráfica de control de 3 sigmas con línea de 
centro en p 0 y basada en n = 5. Suponiendo normalidad, 
calcule la probabilidad de que un solo punto caiga fuera de 
los límites de control cuando la media real del proceso sea 


a. p 0 + 0.5cr 

b. p 0 - a 

c. p 0 + 2cr 

6. La tabla de la página 636 da información sobre el conteni¬ 
do de humedad para especímenes de cierto tipo de tela. De¬ 
termine los límites de control para una gráfica con línea de 
centro a una altura de 13.00 con base en cr = 0.600, cons¬ 
truya la gráfica de control y comente sobre su aspecto. 
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Datos para el ejercicio 6 


Muestra núm. 


Observaciones de contenido de humedad 


X 

s 

Rango 

1 

12.2 

12.1 

13.3 

13.0 

13.0 

12.72 

0.536 

1.2 

2 

12.4 

13.3 

12.8 

12.6 

12.9 

12.80 

0.339 

0.9 

3 

12.9 

12.7 

14.2 

12.5 

12.9 

13.04 

0.669 

1.7 

4 

13.2 

13.0 

13.0 

12.6 

13.9 

13.14 

0.477 

1.3 

5 

12.8 

12.3 

12.2 

13.3 

12.0 

12.52 

0.526 

1.3 

6 

13.9 

13.4 

13.1 

12.4 

13.2 

13.20 

0.543 

1.5 

7 

12.2 

14.4 

12.4 

12.4 

12.5 

12.78 

0.912 

2.2 

8 

12.6 

12.8 

13.5 

13.9 

13.1 

13.18 

0.526 

1.3 

9 

14.6 

13.4 

12.2 

13.7 

12.5 

13.28 

0.963 

2.4 

10 

12.8 

12.3 

12.6 

13.2 

12.8 

12.74 

0.329 

0.9 

11 

12.6 

13.1 

12.7 

13.2 

12.3 

12.78 

0.370 

0.9 

12 

13.5 

12.3 

12.8 

13.1 

12.9 

12.92 

0.438 

1.2 

13 

13.4 

13.3 

12.0 

12.9 

13.1 

12.94 

0.559 

1.4 

14 

13.5 

12.4 

13.0 

13.6 

13.4 

13.18 

0.492 

1.2 

15 

12.3 

12.8 

13.0 

12.8 

13.5 

12.88 

0.432 

1.2 

16 

12.6 

13.4 

12.1 

13.2 

13.3 

12.92 

0.554 

1.3 

17 

12.1 

12.7 

13.4 

13.0 

13.9 

13.02 

0.683 

1.8 

18 

13.0 

12.8 

13.0 

13.3 

13.1 

13.04 

0.182 

0.5 

19 

12.4 

13.2 

13.0 

14.0 

13.1 

13.14 

0.573 

1.6 

20 

12.7 

12.4 

12.4 

13.9 

12.8 

12.84 

0.619 

1.5 

21 

12.6 

12.8 

12.7 

13.4 

13.0 

12.90 

0.316 

0.8 

22 

12.7 

13.4 

12.1 

13.2 

13.3 

12.94 

0.541 

1.3 


7 . Consulte la información dada en el ejercicio 6 y construya 
una gráfica de control con una línea de centro estimada y lí¬ 
mites basados en el uso de desviaciones muéstrales están¬ 
dar para estimar <x. ¿Hay alguna evidencia de que el proceso 
está fuera de control? 

8. Consulte los ejercicios 6 y 7 y ahora utilice límites de con¬ 
trol con base en el uso de rangos muéstrales para estimar a. 
¿El proceso parece estar bajo control? 

9. La tabla siguiente da medias muéstrales y desviaciones es¬ 
tándar, cada una basada en n = 6 observaciones del índice 
de refracción de cable de fibra óptica. Construya una gráfi¬ 
ca de control y comente sobre su aspecto. [Sugerencia: 
2jx, = 2317.07 y = 30.34.] 


Día 

X 

s 

Día 

X 

s 

1 

95.47 

1.30 

9 

96.63 

1.48 

2 

97.38 

0.88 

10 

96.50 

0.80 

3 

96.85 

1.43 

11 

97.22 

1.42 

4 

96.64 

1.59 

12 

96.55 

1.65 

5 

96.87 

1.52 

13 

97.02 

1.28 

6 

96.52 

1.27 

14 

95.55 

1.14 

7 

96.08 

1.16 

15 

96.29 

1.37 

8 

96.48 

0.79 

16 

96.80 

1.40 


(continúa) 


Día 

X 

s 

Día 

X 

s 

17 

96.01 

1.58 

21 

97.06 

1.34 

18 

95.39 

0.98 

22 

98.34 

1.60 

19 

96.58 

1.21 

23 

96.42 

1.22 

20 

96.43 

0.75 

24 

95.99 

1.18 


10 . Consulte el ejercicio 9. Se encontró una causa asignable pa¬ 
ra el inusualmente alto índice de refracción promedio mues- 
tral el día 22. Recalcule los límites de control después de 
borrar la información de este día. ¿Qué concluye el lector? 

11 . Considere la gráfica de control basada en los límites de con¬ 
trol /a 0 ± 2.81 tr/Vñ. 

a. ¿Cuál es la ARL cuando el proceso está bajo control? 

b. ¿Cuál es la ARL cuando n = 4 y la media del proceso se 
ha cambiado a ¿i = /r 0 + cr? 

c. ¿Cómo se comparan los valores de los incisos a y b en 
función de los valores correspondientes para una gráfica 
de 3 sigmas? 

12 . Aplique las reglas suplementarias, sugeridas en el texto, a la 
información del ejercicio 6. ¿Hay alguna señal fuera de 
control? 

13 . Calcule los límites de control para la información del ejer¬ 
cicio 6, usando el procedimiento robusto presentado en es¬ 
ta sección. 
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| 16.3 Gráficas de control para variación de proceso 

Las gráficas de control estudiadas en la sección previa se diseñaron para controlar la ubica¬ 
ción (o bien, lo que es lo mismo, la tendencia central) de un proceso, con particular atención 
a la media como medida de ubicación. Es igualmente importante asegurar que un proceso 
está bajo control con respecto a variaciones. De hecho, casi todos los expertos recomiendan 
que se establezca un control sobre variaciones antes de construir una gráfica X, o cualquier 
otra gráfica para controlar la ubicación. En esta sección, se consideran gráficas para varia¬ 
ciones con base en la desviación muestral estándar S y también gráficas basadas en el ran¬ 
go muestral R. Generalmente se prefieren las primeras porque la desviación estándar da una 
evaluación más eficiente de variación que el rango, pero las gráficas R se usaron primero y 
prevalece la tradición. 

La gráfica 5 

De nuevo se supone que se dispone de k muestras seleccionadas de manera independiente, 
cada una formada por n observaciones en una variable distribuida normalmente. Denote las 
desviaciones muéstrales estándar por s 2 ■ ■ . , s k , con s = Y.s¡/k. Los valores .vj, ,v 2 , 
í 3 , . . . se trazan en secuencia en una gráfica S. La línea de centro de la gráfica estará a una 
altura s y los límites de 3-sigma necesitan determinar 3 cr s (al igual que los límites de 3-sig- 
ma de una gráfica X requirieron 3cr^ = 3rr/Vn, con u entonces estimada a partir de la in¬ 
formación). 

Recuerde que para cualquier variable aleatoria Y, V(Y) = E(Y 2 ) — [E(Y)] 2 y que una 
varianza muestral S 1 es un estimador insesgado de cr 2 , es decir, E(S 2 ) = a 2 . Entonces, 

V(S) = E(S 2 ) - [£(S)] 2 = ir 2 - ( a n a ) 2 = m 2 (l - a 2 ) 

donde los valores de a n para n = 3, . . . , 8 se tabularon en la sección previa. La desviación 
estándar de S es entonces 

cr s = VV(S) = cr VI — a 2 

Es natural estimar cr usando s { ,..., s k como se hizo en la sección previa, es decir, & = s/a n . 
Sustituyendo cr por cr en la expresión cr s resulta la cantidad empleada para calcular límites 
de 3-sigma. 


Los límites de control de 3-sigma para una gráfica de control S son 

LIC = s- 3s V1 — a\ta n 
LSC = s + 3íV 1 - a\la n 

La expresión para LIC será negativa si n < 5, en cuyo caso se acostumbra usar 

LIC = 0. 


Ejemplo 16.4 La tabla 16.2 muestra observaciones sobre la resistencia al esfuerzo en láminas de plástico 
(la fuerza, en libras por pulgada cuadrada, necesaria para agrietar una lámina). Hay k = 22 
muestras, obtenidas en puntos de tiempo igualmente espaciados y n = 4 observaciones en 
cada muestra. Con facilidad se verifica que = 51.10 y s = 2.32, de modo que el centro 
de la gráfica S estará en 2.32 (aun cuando n = 4, el límite inferior de control (LIC) = 0 
y la línea de centro no estará a la mitad entre los límites de control). De la sección previa, 
a 4 = 0.921, de donde el límite superior de control (LSC) es 

LSC = 2.32 + 3(2.32)(V 1 - (0.921) 2 /0.921 
= 2.32 + 2.94 
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Tabla 16.2 Datos sobre resistencia al esfuerzo para el ejemplo 16.4 


Muestra núm. Observaciones Desviación estándar Rango 


1 

29.7 

29.0 

28.8 

30.2 

0.64 

1.4 

2 

32.2 

29.3 

32.2 

32.9 

1.60 

3.6 

3 

35.9 

29.1 

32.1 

31.3 

2.83 

6.8 

4 

28.8 

27.2 

28.5 

35.7 

3.83 

8.5 

5 

30.9 

32.6 

28.3 

28.3 

2.11 

4.3 

6 

30.6 

34.3 

34.8 

26.3 

3.94 

8.5 

7 

32.3 

27.7 

30.9 

27.8 

2.30 

4.6 

8 

32.0 

27.9 

31.0 

30.8 

1.76 

4.1 

9 

24.2 

27.5 

28.5 

31.1 

2.85 

6.9 

10 

33.7 

24.4 

34.3 

31.0 

4.53 

9.9 

11 

35.3 

33.2 

31.4 

28.0 

3.09 

7.3 

12 

28.1 

34.0 

31.0 

30.8 

2.41 

5.9 

13 

28.7 

28.9 

25.8 

29.7 

1.71 

3.9 

14 

29.0 

33.0 

30.2 

30.1 

1.71 

4.0 

15 

33.5 

32.6 

33.6 

29.2 

2.07 

4.4 

16 

26.9 

27.3 

32.1 

28.5 

2.37 

5.2 

17 

30.4 

29.6 

31.0 

33.8 

1.83 

4.2 

18 

29.0 

28.9 

31.8 

26.7 

2.09 

5.1 

19 

33.8 

30.9 

31.7 

28.2 

2.32 

5.6 

20 

29.7 

27.9 

29.1 

30.1 

0.96 

2.2 

21 

27.9 

27.7 

30.2 

32.9 

2.43 

5.2 

22 

30.0 

31.4 

27.7 

28.1 

1.72 

3.7 


La gráfica de control resultante se ilustra en la figura 16.3. Todos los puntos dibujados es¬ 
tán contenidos dentro de los límites de control, lo que sugiere un comportamiento estable 
del proceso con respecto a variaciones. 


6.0 


4.0 - 


2.0 - 


0.0 


Límite superior de control 


Límite inferior de control 

..i. 


10 


15 


20 


Nmero 
de muestra 


Figura 16.3 Gráfica 5 para datos de resistencia al esfuerzo del ejemplo 16.4. ■ 


La gráfica R 

Denote con r h r 2 ,, r k los k rangos muéstrales y 7 = YjJk. La línea de centro de una grá¬ 
fica R estará a una altura r. La determinación de los límites de control requiere cr R , donde R 
denota el rango (antes de hacer observaciones, como una variable aleatoria) de una muestra 
aleatoria de tamaño n de una distribución normal, con valor medio p, y desviación estándar cr. 
Como 


R = máxtAj, . . . , X n ) — mín(Aj, . . . , X n ) 

= o-{máx(Z 1; . . . , ZJ - mín(Z!, . . . , Z„)} 
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(Continúa del 
ejemplo 16.4) 
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donde Z, = (X¡ — y las Z¡ son variables aleatorias normales estándar, se deduce que 

desviación estándar del rango de una muestra aleatoria de 
tamaño n de una distribución normal estándar 

n 

Los valores de c„ para n = 3, . . . , 8 aparecen en la tabla siguiente. 



n 

3 

4 

5 

6 

7 

8 

C n 

0.888 

0.880 

0.864 

0.848 

0.833 

0.820 


Se acostumbra estimar cr por medio de & = r/b n como se vio en la sección previa. Esto da 
(t r = c n r/b n como la desviación estándar estimada de R. 


Los límites de 3-sigma para una gráfica R son 

LIC = ~r - 3c n ?/b n 
LSC = r + 3 cjlb n 

La expresión para LIC será negativa si n < 6, en cuyo caso debería usarse LIC = 0. 


La tabla 16.2 da 2,r¡ = 115.3 y r = 5.24. Como n = 4, el límite inferior de control = 0. Con 
¿> 4 = 2.058 y c 4 = 0.880 

LSC = 5.24 + 3(0.880)(5.24)/2.058 = 11.96 

La gráfica R aparece en la figura 16.4. Al igual que con la gráfica S, todos los puntos están 
entre los límites, lo cual indica un proceso bajo control en cuanto se refiere a variaciones. 
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muestral 


15.0 - 
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0.0 
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20 
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Figura 16.4 Gráfica R para datos de resistencia al esfuerzo del ejemplo 16.5. 


























cl6_p625-662.gxd 3/12/08 4:41 AM Page 640 
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Gráficas basadas en límites de probabilidad 

Considere una gráfica X basada en el valor /i 0 e incógnita a bajo control (objetivo). Cuan¬ 
do la variable de interés está normalmente distribuida y el proceso está bajo control, 

P(X¡ > /a 0 + 3 <r/Vñ) = 0.0013 = P(x¡ < / jl 0 - 3tr/Vñ) 

Esto es, la probabilidad de que un punto en la gráfica caiga arriba del límite superior de con¬ 
trol es 0.0013, como es la probabilidad de que el punto caiga abajo del límite inferior de 
control (si se usa 3.09 en lugar de 3 resulta 0.001 para cada probabilidad). Cuando los lími¬ 
tes de control se basan en estimaciones de ¡jl y cr, estas probabilidades serán aproximada¬ 
mente correctas siempre que n no sea demasiado pequeña y k sea al menos 20. 

En contraste, no es el caso para una gráfica S de 3-sigma que P(S ¡ > LSC) = 
P(S¡ < LIC)= 0.0013, ni es verdadero para una gráfica R de 3-sigma que P(R i > LSC) = 
P(R i < LIC) = 0.0013. Esto es porque ni la desviación estándar muestral S ni el rango 
muestral R tienen una distribución normal aun cuando la distribución poblacional sea nor¬ 
mal. En cambio, tanto S como R tienen distribuciones sesgadas. Lo mejor que se puede de¬ 
cir para gráficas S y R de 3-sigma es que es bastante improbable que un proceso bajo control 
dé un punto, en cualquier tiempo particular, que esté fuera de los límites de control. Algu¬ 
nos autores han estado a favor del uso de los límites de control para los cuales la “probabi¬ 
lidad de rebase” para cada límite es aproximadamente 0.001. El libro Statistical Methods for 
Quality Improvement (vea la bibliografía del capítulo) contiene más información sobre este 
tema. 


EJERCICIOS Sección 16.3 (14-18) 


14. Un fabricante de tiza sin polvo instituyó un programa de 17. 
control de calidad para vigilar la densidad de la tiza. Las 
desviaciones muéstrales estándares de densidades de 24 
subgrupos diferentes, cada uno formado por n = 8 especí¬ 
menes de tiza, fueron como sigue: 


0.204 

0.315 

0.096 

0.184 

0.230 

0.212 

0.322 

0.287 

0.145 

0.211 

0.053 

0.145 

0.272 

0.351 

0.159 

0.214 

0.388 

0.187 

0.150 

0.229 

0.276 

0.118 

0.091 

0.056 


Calcule límites para una gráfica 5, construya la gráfica y 
verifique que no haya puntos fuera de control. Si hay un 
punto fuera de control, bórrelo y repita el proceso. 

15. Una vez por hora, de una línea de ensamble se seleccionan 
subgrupos de unidades de fuentes de alimentación para de¬ 
terminar la salida de alto voltaje de cada unidad. 

a. Suponga que la suma de las variaciones muéstrales re¬ 
sultantes para 30 subgrupos, cada uno formado por cua¬ 
tro unidades, es 85.2. Calcule los límites de control para 
una gráfica R. 

b. Repita el inciso a si cada subgrupo está formado por 
ocho unidades y la suma es 106.2. 

16. Calcule los límites de control para una gráfica S y para una 
gráfica R usando la información del contenido de humedad 
del ejercicio 6. A continuación busque la presencia de cua¬ 
lesquiera señales fuera de control. 


Calcule los límites de control para una gráfica S desde la 
información de índice de refracción del ejercicio 9. ¿El pro¬ 
ceso parece estar bajo control con respecto a la variabili¬ 
dad? ¿Por qué sí o por qué no? 

18. Cuando S 2 es la varianza muestral de una muestra aleatoria 
normal, (n — l)S 2 /cr 2 tiene una distribución ji cuadrada con 
n — 1 grado de libertad, de modo que 

pU c^-^cx 2 Uo998 

1 l4o.999.n-l a 2 A-O.OOlji-lj 

de la que 

/ cr 2 y 2 

A 0.999,n-l 

[ n - 1 

Esto sugiere que una gráfica alternativa, para controlar la 
variación del proceso, consiste en trazar las varianzas mués¬ 
trales y usar límites de control 

UC = 7Y- 999n _ 1 /(n-l) 

LSC = 7 X.m,n-A n ~ !) 

Construya la gráfica correspondiente para los datos del ejer¬ 
cicio 9. [Sugerencia: Los valores críticos de ji cuadrada de 
cola inferior y superior para 5 grados de libertad son 0.210 y 
20.515, respectivamente.] 


* 0001 ;" 1 ) = 0.998 
n — 1 / 
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| 16.4 Gráficas de control para atributos 

El término datos de atributos se usa en literatura de control de calidad para describir dos si¬ 
tuaciones: 

1. Cada pieza producida es defectuosa o no defectuosa (se apega a especificaciones o no se 
apega). 

2. Una sola pieza puede tener uno o más defectos y el número de defectos se determina. 

En el primer caso, una gráfica de control está basada en la distribución binomial; en el últi¬ 
mo, la distribución Poisson es la base para una gráfica. 

La gráfica p para fracción defectuosa 

Suponga que cuando un proceso está bajo control, la probabilidad de que cualquier pieza 
sea defectuosa es p (o bien, lo que es lo mismo, p es la proporción a largo plazo de piezas 
defectuosas para un proceso bajo control) y que diferentes piezas son independientes una de 
otra con respecto a sus condiciones. Considere una muestra de n piezas obtenida en un tiem¬ 
po particular y sea X el número de las defectuosas y p = X/n. Debido a que X tiene una dis¬ 
tribución binomial, E(X) = np y V(X) = np{\ — p), así 

p( 1 - p) 

E(p)=p V(p) = ~ -— 

n 

También, si np > 10 y n( 1 — p) > 10, p tiene aproximadamente una distribución normal. 

En el caso de p conocida (o una gráfica basada en un valor objetivo), los límites de 
control son 

Límite inferior //?(1 — p) Límite superior / p( 1 — p) 

de control ~ P ~ 3 y ~ de control — P “ 

Si cada muestra está formada por n piezas, el número de las defectuosas de la z'-ésima mues¬ 
tra es x¡, y p¡ = x¡/n, entonces /3¡, p 2 , /3 3 , . . . se determinan en la gráfica de control. 

Generalmente el valor de p debe estimarse a partir de los datos. Suponga que se dis¬ 
pone de k muestras de lo que se piensa que es un proceso bajo control, y que 

k 



La estimación p se usa entonces en lugar de p en los límites de control mencionados líneas 
antes. 


La gráfica p para la fracción de piezas defectuosas tiene su línea de centro a una al¬ 
tura p y límites de control 


LIC =p~ 3 1 


P( 1 - P) 


LSC = p + 3 1 


/XI -P ) 


Si el límite inferior de control es negativo, se sustituye con 0. 
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Ejemplo 16.6 Una muestra de 100 tazas de una figura particular de vajilla se seleccionó en cada uno de 
25 días sucesivos y cada una se examinó en busca de defectos. Los números resultantes 
de tazas inaceptables y de proporciones muéstrales correspondientes son como sigue: 


Día ( i ) 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

x¡ 

7 

4 

3 

6 

4 

9 

6 

7 

5 

3 

7 

8 

4 

P¡ 

0.07 

0.04 

0.03 0.06 0.04 0.09 

0.06 0.07 

0.05 

0.03 

0.07 

0.08 

0.04 

Día ( i ) 

14 

15 

16 

17 

18 


19 

20 


21 

22 

23 

24 

25 

x¡ 

6 

2 

9 

7 

6 


7 

11 


6 

7 

4 

8 

6 

P¡ 

0.06 

0.02 

0.09 

0.07 

0.06 

0.07 

0.11 

0.06 

0.07 

0.04 

0.08 

0.06 



Suponiendo que el proceso estaba bajo control durante este periodo, establezca los límites 
de control y construya una gráfica p. Se tiene que Yj 'p, = 1.52, lo que da p = 1.52/25 = 
0.0608 y 

LIC = 0.0608 - 3 V(0.0608)(0.9392)/100 = 0.0608 - 0.0717 = -0.0109 
LSC = 0.0608 + 3 V (0.0608)(0.9392)/100 = 0.0608 + 0.0717 = 0.1325 

Por tanto, el límite inferior de control está en 0. La gráfica de control ilustrada en la figu¬ 
ra 16.5 muestra que todos los puntos están dentro de los límites de control. Esto es consis¬ 
tente con la suposición de un proceso bajo control. 


P 




Límite superior de control 

0.10 




• 

• 


• • • 

• • • 


• • 

• • • • 

0.05 

- 

• • 

• • 



1 1 

Límite inferior de control 

i i i r 

0 

5 10 

15 20 25 


Figura 16.5 Gráfica de control para datos de fracción defectuosa del ejemplo 16.6. 



La gráfica c para el número de defectos 

A continuación se consideran situaciones en las que la observación de cada punto en el tiem¬ 
po es el número de defectos en una unidad de algún tipo. La unidad puede consistir en una 
sola pieza (por ejemplo un automóvil) o un grupo de piezas (por ejemplo, defectos en un 
conjunto de cuatro llantas). En el segundo caso, se supone que el tamaño del grupo es igual 
en cada uno de los puntos de tiempo. 

La gráfica de control para números de defectos está basada en la distribución de pro¬ 
babilidad Poisson. Recuerde que si Y es una variable aleatoria Poisson con parámetro 0, en¬ 
tonces 


E(Y) = 0 V(Y) = 0 a Y =V0 
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También, Y tiene aproximadamente una distribución normal cuando 0 es grande ( 0 > 10 
será suficiente para la mayor parte de los casos). Además, si Y u Y 2 , . . . , Y n son variables 
Poisson independientes con parámetros 0¡, 0 2 ,. . ., 0 n , se puede demostrar que T, + • • ■ + Y n 
tiene una distribución Poisson con parámetro + • • • + 0 n . En particular, si 0 l = • • ■ = 
0 n = 0 (la distribución del número de defectos por pieza es igual para cada una de éstas), 
entonces el parámetro Poisson es A = nO. 

Denote con A el parámetro de Poisson para el número de defectos en una unidad (es 
el número esperado de defectos por unidad). En el caso de A conocida (o una gráfica basa¬ 
da en un valor objetivo), 


LIC = A - 3Vl LSC = A + 3V^ 

Con x¡ denotando el número total de defectos en la f-ésima unidad (i = 1, 2, 3, ...), enton¬ 
ces los puntos en las alturas x h x 2 , x 3 ,. . . se determinan en la gráfica. Por lo general, el va¬ 
lor de A debe estimarse a partir de los datos. Como E(X¡) = A, es natural usar la estimación 
A = x (basada en x,, x 2 , . . . , x k ). 



La gráfica c para el número de defectos en una unidad tiene línea de centro a una al¬ 
tura x y 

LIC = x - 3Vx 
LSC = x + 3Vx 

Si el límite inferior de control (LIC) es negativo, se sustituye con 0. 


Ejemplo 16.7 Una compañía manufactura paneles metálicos que se hornean después de cubrirlos con una 
mezcla de cerámica en polvo. A veces aparecen fallas en el acabado de estos paneles y la 
compañía desea establecer una gráfica de control para determinar el número de fallas. Los 
números de fallas de cada uno de los 24 paneles muestreados en intervalos regulares son co¬ 
mo sigue: 

7 10 9 12 13 6 13 7 5 11 8 10 

13 9 21 10 6 8 3 12 7 11 14 10 

Con £x¡ = 235 y Á = x = 235/24 = 9.79. Los límites de control son 

LIC = 9.79 - 3V9/79 = 0.40 LSC = 9.79 + 3V9J9 = 19.18 

La gráfica de control está en la figura 16.6 (página 644). El punto correspondiente del 15avo 
panel está arriba del límite superior de control. Al hacer la investigación, se encontró que la 
mezcla empleada en ese panel tenía una viscosidad demasiado baja (una causa asignable). 
La eliminación de esa observación del conjunto de información da x = 214/23 = 9.30 y 
nuevos límites de control. 

LIC = 9.30 - 3V93Ó = 0.15 LSC = 9.30 + 3V93Ó = 18.45 
Las 23 observaciones restantes están entre estos límites, lo cual indica un proceso bajo control. 
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x 

20 - 


15 


Límite superior de control original 


Límite superior de control final 


10 



5 


0 5 


10 


Límite inferior de control original 

Límite inferior de control final 

Número 
de muestra 

15 20 


J I I I I I I L 


/ 


Figura 16.6 Gráfica de control para el número de datos de fallas del ejemplo 16.7 ■ 


Gráficas de control basadas en datos transformados 

Se presume que el uso de límites de control de 3-sigma da por resultado en /'(estadística < lí¬ 
mite inferior de control) ~ /'(estadística > límite superior de control) ~ 0.0013 cuando el 
proceso está bajo control. No obstante, cuando p es pequeña, la aproximación normal a la 
distribución de p = Xln con frecuencia no será muy precisa en las colas de extremo. La ta¬ 
bla 16.3 da evidencia de este comportamiento para valores seleccionados de p y n (el valor 
de p se usa para calcular los límites de control). En muchos casos, la probabilidad de que 
un solo punto caiga fuera de los límites de control es muy diferente de la probabilidad no¬ 
minal de 0.0026. 


Tabla 16.3 Probabilidades bajo control para una gráfica p 


p 

71 

P(p < LIC) 

P(p > LCS) 

/'(punto fuera de control) 

0.10 

100 

0.00003 

0.00198 

0.00201 

0.10 

200 

0.00048 

0.00299 

0.00347 

0.10 

400 

0.00044 

0.00171 

0.00215 

0.05 

200 

0.00004 

0.00266 

0.00270 

0.05 

400 

0.00020 

0.00207 

0.00227 

0.05 

600 

0.00031 

0.00189 

0.00220 

0.02 

600 

0.00007 

0.00275 

0.00282 

0.02 

800 

0.00036 

0.00374 

0.00410 

0.02 

1000 

0.00023 

0.00243 

0.00266 


Este problema se puede solucionar si se aplica una transformación a los datos. Deno¬ 
te con h(X) una función aplicada para transformar la variable binomial X. Entonces /(•) de¬ 
be seleccionarse de modo que h(X) tenga aproximadamente una distribución normal y esta 
aproximación sea precisa en las colas. Una transformación recomendada está basada en la 
función arcsen (es decir, sen -1 ): 


Y = h(X) = sen '(Vx/n) 
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Entonces Y es aproximadamente normal con valor medio se n H (V p) y varianza 1/(4n); nó¬ 
tese que la varianza es independiente de p. Sea y¡ = sen '(Vx,//;). Los puntos en la gráfica 
de control están localizados a alturas y lt y 2 .Para n conocida, los límites de control son 

LIC = sen -1 (Vp) - 3Vl/(4n) LSC = s en\Vp) + 3Vl/(4«) 

Cuando p es desconocida, sen '(Vp) se sustituye con y. 

Se aplican comentarios semejantes a la distribución Poisson cuando A es pequeña. La 
transformación sugerida es Y = h(X) = 2 V A, que tiene valor medio 2 VA y varianza 1. 
Los límites de control resultantes son 2 VX ± 3 cuando A se conoce y y ± 3 cuando no se 
conoce. El libro Statistical Methods for Quality Improvement de la bibliografía del capítulo 
examina en gran detalle estos problemas. 


EJERCICIOS Sección 16.4 (19-26) 


19. En cada uno de los 25 días previos, 100 aparatos electróni¬ 
cos de cierto tipo se seleccionaron al azar y se sometieron a 
una severa prueba de esfuerzo debido al calor. El número 
total de piezas que no pasaron la prueba fue de 578. 

a. Determine los límites de control para una gráfica/? de 3- 
sigma. 

b. El número más alto de piezas que no pasaron la prueba 
en un día determinado fue 39 y el número más bajo fue 
13. ¿Cualquiera de estos números corresponde a un pun¬ 
to fuera de control? Explique. 

20. Se seleccionó en cada uno de 30 días consecutivos una 
muestra de 200 chips de ROM de computadora y el núme¬ 
ro de chips que no se apegaron a especificaciones en cada 
día fue como sigue: 10, 18, 24, 17, 37, 19, 7, 25, 11, 24, 29, 
15, 16, 21, 18, 17, 15, 22, 12, 20, 17, 18, 12, 24, 30, 16, 11, 
20, 14, 28. Construya una gráfica p y examínela en busca de 
cualquier punto fuera de control. 

21. Cuando n = 150, ¿cuál es el valor más pequeño de p para el 
que el límite inferior de control de una gráfica p es positivo? 

22. Consulte la información del ejercicio 20 y construya una 
gráfica de control usando la transformación sen -1 como se 
sugirió en el texto. 

23. Las observaciones siguientes son números de defectos en 
25 especímenes de una yarda cuadrada de tela tejida de 
cierto tipo: 3, 7, 5, 3, 4, 2, 8, 4, 3, 3, 6, 7, 2, 3, 2, 4, 7, 3, 2, 
4, 4, 1, 5, 4, 6. Construya una gráfica c para hallar el núme¬ 
ro de defectos. 

24. ¿Para qué valores x será negativo el límite inferior de con¬ 
trol en una gráfica c? 

25. En algunas situaciones, varían los tamaños de especímenes 
muestreados y se espera que especímenes más grandes ten¬ 
gan más defectos que los más pequeños. Por ejemplo, los 
tamaños de muestras de telas inspeccionadas en busca de 
defectos pueden variar en el tiempo. Alternativamente, el nú¬ 
mero de piezas inspeccionadas podría cambiar con el tiem¬ 
po. Sea 

el número de defectos observados en el tiempo i 

ti, = - 

tamaño de entidad inspeccionada en el tiempo i 

= ÍL 
Sí 


donde “tamaño” puede referirse a área, longitud, volumen, 
o simplemente el número de piezas inspeccionadas. Enton¬ 
ces una carta u dibuja u v u 2 , . . . , tiene línea de centro m, 
y los límites de control para las í-ésimas observaciones son 

m ± 3 Vü/g,.. 

Se examinaron paneles pintados en secuencia de tiempo y, 
para cada uno, se determinó el número de defectos en una re¬ 
gión de muestreo especificada. El área superficial (en pies 
cuadrados) de la región examinada varió de panel en panel. 
Los resultados se dan a continuación. Construya una gráfica u. 

Área Núm. de 


Panel 

examinada 

defectos 

1 

0.8 

3 

2 

0.6 

2 

3 

0.8 

3 

4 

0.8 

2 

5 

1.0 

5 

6 

1.0 

5 

7 

0.8 

10 

8 

1.0 

12 

9 

0.6 

4 

10 

0.6 

2 

11 

0.6 

1 

12 

0.8 

3 

13 

0.8 

5 

14 

1.0 

4 

15 

1.0 

6 

16 

1.0 

12 

17 

0.8 

3 

18 

0.6 

3 

19 

0.6 

5 

20 

0.6 

1 


26. Construya una gráfica de control para la información del 
ejercicio 23, mediante el uso de la transformación sugerida 
en el texto. 


























cl6_p625-662.qxd 3/12/08 4:42 AM Page 646 



646 CAPÍTULO 16 Métodos de control de calidad 


| 16.5 Procedimientos CUSUM 

Un defecto de la gráfica X tradicional es su incapacidad para detectar un cambio relativa¬ 
mente pequeño en la media de un proceso. Esto es, en gran medida, consecuencia del hecho 
de que si un proceso se juzga como fuera de control en un tiempo particular depende sólo de 
la muestra en ese tiempo y no de la historia pasada del proceso. Se han diseñado proce¬ 
dimientos y gráficas de control de suma acumulativa (CUSUM) para solucionar este de¬ 
fecto. 

Hay dos versiones equivalentes de un procedimiento CUSUM para la media de un 
proceso, una gráfica y otra computacional. Esta última se emplea casi exclusivamente en 
la práctica, pero la lógica que hay detrás del procedimiento se entiende con más facilidad si 
se considera primero la forma gráfica. 

La mascarilla V 

Denote con /j, 0 un valor objetivo o meta para la media del proceso y defina sumas acumula¬ 
tivas con 


Si 

^2 


= *1 - Mo 


2 

= (*1 - ^ 0 ) + (*2 - /%> = 2 ( x , ~ /¿ o ) 

í=l 



1 

S, = (*j - fl 0 ) +■■■+ (x, - lí 0 ) =1. (x¡ - Mo) 

i=l 

(en ausencia de un valor objetivo, se usa x en lugar de ¡ u 0 ). Estas sumas acumulativas se de¬ 
terminan en el tiempo, es decir, en el tiempo /, se localiza un punto a una altura S¡. En el 
punto r del tiempo actual, los puntos dibujados son (1, 5j), (2, S 2 ), (3, .S' 3 ), . . . , (r, S r ). 

Enseguida se superpone una “mascarilla” en forma de V sobre la gráfica, como se ve 
en la figura 16.7. El punto 0, que se encuentra a una distancia d atrás del punto en el que se 
cruzan dos brazos de la mascarilla, está posicionado en el actual punto CUSUM ir, S r ). En 
el tiempo r, el proceso se juzga fuera de control si cualquiera de los puntos dibujados se en¬ 
cuentra fuera de la mascarilla V, ya sea arriba del brazo superior o abajo del brazo inferior. 
Cuando el proceso está bajo control, las x ¡varían alrededor del valor objetivo ¡± {) , de modo 
que las S¡ sucesivas deben variar alrededor del 0. Suponga, no obstante, que en cierto tiem¬ 
po, la media del proceso cambia a un valor más grande que el objetivo. De ese punto en ade¬ 
lante, las diferencias x¡ — ¡jl 0 tenderán a ser positivas, de modo que las S¡ sucesivas 
aumentarán y los puntos dibujados se desplazarán hacia arriba. Si ha ocurrido un cambio an¬ 
tes del punto r actual de tiempo, hay una buena probabilidad de que ir, S r ) sea considera¬ 
blemente más alto que algunos otros puntos de la gráfica, en cuyo caso estos otros puntos 
estarán debajo del brazo inferior de la mascarilla. Del mismo modo, un cambio a un valor 
menor que el objetivo dará por resultado subsecuentemente puntos arriba del brazo superior de 
la mascarilla. 

Cualquier mascarilla V particular se determina al especificar la “distancia de avance” 
d y el “semiángulo” 0, o bien, lo que es equivalente, al especificar d y la longitud h del seg¬ 
mento vertical de recta de 0 al brazo inferior (o al superior) de la mascarilla. Un método pa¬ 
ra determinar cuál mascarilla usar consiste en especificar el tamaño de un cambio en la 
media de un proceso que sea de particular interés para un investigador. Entonces los pará¬ 
metros de la mascarilla se seleccionan para dar valores deseados de a y /3, la probabilidad 
de falsa alarma y la probabilidad de no detectar el cambio especificado, respectivamente. Un 
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Figura 16.7 Gráficas CUSUM: a) puntos sucesivos (/, 5,) en una gráfica CUSUM; b) una mascarilla V 
con 0 = (r, S); c) un proceso bajo control; d) un proceso fuera de control. 



método alternativo consiste en seleccionar la mascarilla que dé valores especificados de la 
magnitud promedio de lote (ARL) para un proceso bajo control y para un proceso en el que 
la media haya cambiado en una cantidad designada. Después de desarrollar la forma compu- 
tacional del procedimiento CUSUM, se ilustrará el segundo método de construcción. 

Una compañía de productos de madera manufactura briquetas de carbón vegetal para bar¬ 
bacoas. Empaca estas briquetas en bolsas de varios tamaños, el más grande de los cuales se 
supone que contiene 40 libras. La tabla 16.4 muestra los pesos de bolsas de 16 muestras di¬ 
ferentes, cada una de tamaño n = 4. Las primeras 10 de éstas se extrajeron de una distribu¬ 
ción normal con p, = p, 0 = 40 y cr = 0.5. Comenzando con la muestra 11, la media ha 
cambiado hacia arriba a fi = 40.3. 


Tabla 16.4 Observaciones, x y sumas acumulativas para el ejemplo 16.8 


Número 


de muestra 


Observaciones 

X 

Xíi, - 40) 


1 

40.77 

39.95 

40.86 

39.21 

40.20 

0.20 

2 

38.94 

39.70 

40.37 

39.88 

39.72 

-0.08 

3 

40.43 

40.27 

40.91 

40.05 

40.42 

0.34 


(. continúa ) 
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Tabla 16.4 Observaciones, x y sumas acumulativas para el ejemplo 16.8 ( Cont .) 


Número 

de muestra 

Observaciones 


X 

O 

Tf 

1 

\H 

H 

4 

39.55 

40.10 

39.39 

40.89 

39.98 

0.32 

5 

41.01 

39.07 

39.85 

40.32 

40.06 

0.38 

6 

39.06 

39.90 

39.84 

40.22 

39.76 

0.14 

7 

39.63 

39.42 

40.04 

39.50 

39.65 

-0.21 

8 

41.05 

40.74 

40.43 

39.40 

40.41 

0.20 

9 

40.28 

40.89 

39.61 

40.48 

40.32 

0.52 

10 

39.28 

40.49 

38.88 

40.72 

39.84 

0.36 

11 

40.57 

40.04 

40.85 

40.51 

40.49 

0.85 

12 

39.90 

40.67 

40.51 

40.53 

40.40 

1.25 

13 

40.70 

40.54 

40.73 

40.45 

40.61 

1.86 

14 

39.58 

40.90 

39.62 

39.83 

39.98 

1.84 

15 

40.16 

40.69 

40.37 

39.69 

40.23 

2.07 

16 

40.46 

40.21 

40.09 

40.58 

40.34 

2.41 


La figura 16.8 muestra una gráfica X con línea de centro a una altura 40 y límites de 
control en 

li 0 ± 3o-x = 40 ± 3 • (0.5A/4) = 40 ± 0.75 



X 


Límite superior de control 


40.20 


39.60 


39.00 


Límite inferior de control 


3 6 9 12 15 

Figura 16.8 Gráfica de control X para los datos del ejemplo 16.8. 


Número 
de muestra 



Ningún punto de la gráfica se encuentra fuera de los límites de control. Esta gráfica sugie¬ 
re un proceso estable para el cual la media ha permanecido en su objetivo. 

La figura 16.9 muestra gráficas CUSUM con una mascarilla V particular superpuesta. 
La gráfica de la figura 16.9a) es para el tiempo actual r = 12. Todos los puntos de esta grá¬ 
fica están dentro de los brazos de la mascarilla. No obstante, la gráfica para r = 13 que se 
muestra en la figura 16.9b) da una señal fuera de control. El punto que cae abajo del brazo 
inferior de la mascarilla sugiere un aumento en el valor de la media del proceso. La mascari¬ 
lla en r = 16 es todavía más enfática en su mensaje de fuera de control. Este es un marcado 
contraste respecto a la gráfica X ordinaria. 
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Figura 16.9 Gráficas CUSUM y mascarillas V para datos del ejemplo 16.8: a) mascarilla V en el tiempo 
r = 12, proceso bajo control; b) mascarilla V en el tiempo r — 13, señal fuera de control. ■ 


Forma computacional del procedimiento CUSUM 

Primero se describe la versión computacional del procedimiento CUSUM, luego se mues¬ 
tra su equivalencia a la forma gráfica y finalmente se examina diseñar un procedimiento pa¬ 
ra satisfacer criterios especificados. 


Sea d 0 = e 0 = 0 y se calcula d v d 2 , d v . . . y e¡, e-,, e 3 , . . . en forma repetitiva usan¬ 
do las relaciones 

d, = máx[0, d ¡_j + (x¡ — (/x 0 + fe))] 

(/ = 1, 2, 3, . . .) 

e, = máx[0, e,_ l - (x, - (pi 0 - fe))] 

Aquí el símbolo k denota la pendiente del brazo inferior de la mascarilla V y su valor 
se toma cotidianamente como A/2 (donde A es el tamaño del cambio en ¡i en el que se 
concentra la atención). 

Si en un tiempo actual r, ya sea d r > h o e r > h, el proceso se juzga como fuera 
de control. La primera desigualdad sugiere que la media del proceso ha cambiado a 
un valor mayor que el objetivo, mientras que e r > h indica un cambio a un valor más 
pequeño. 



Reconsidere la información de las briquetas de carbón vegetal que se muestra en la tabla 
16.4 del ejemplo 16.8. El valor objetivo es pt 0 = 40 y el tamaño de un cambio a ser rápida¬ 
mente detectado es A = 0.3. De este modo, 

fe = y = 0.15 /j, 0 + fe = 40.15 ju, 0 -fe = 39.85 

de modo que 

d, = máx[0, d l _ l + (x¡ — 40.15)] 
e¡ = máx[0, e l _ 1 — (x, — 39.85)] 
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El cálculo de las primeras d¡ continúa como sigue: 
d 0 = 0 


máx[0. 

+ 

Jo 

1 

40.15)] 

máx[0. 

0 + (40.20 

- 40.15)] 

0.05 



máx[0, 

d x + (x 2 - 

40.15)] 

máx[0. 

0.05 + (39. 

.72 - 40.15)] 

0 



máx[0, 

d 2 + (x, — 

40.15)] 

máx[0. 

0 + (40.42 

- 40.15)] 

0.27 




Los demás cálculos se resumen en la tabla 16.5. 


Tabla 16.5 Cálculos de CUSUM para el ejemplo 16.9 


Número 

de muestra 


x, - 40.15 

d, 

x, - 39.85 

e i 

1 

40.20 

0.05 

0.05 

0.35 

0 

2 

39.72 

-0.43 

0 

-0.13 

0.13 

3 

40.42 

0.27 

0.27 

0.57 

0 

4 

39.98 

-0.17 

0.10 

0.13 

0 

5 

40.06 

-0.09 

0.01 

0.21 

0 

6 

39.76 

-0.39 

0 

-0.09 

0.09 

7 

39.65 

-0.50 

0 

-0.20 

0.29 

8 

40.41 

0.26 

0.26 

0.56 

0 

9 

40.32 

0.17 

0.43 

0.47 

0 

10 

39.84 

-0.31 

0.12 

-0.01 

0.01 

11 

40.49 

0.34 

0.46 

0.64 

0 

12 

40.40 

0.25 

0.71 

0.55 

0 

13 

40.61 

0.46 

1.17 

0.76 

0 

14 

39.98 

-0.17 

1.00 

0.13 

0 

15 

40.23 

0.08 

1.08 

0.38 

0 

16 

40.34 

0.19 

1.27 

0.49 

0 


El valor h = 0.95 da un procedimiento CUSUM con propiedades deseables, es decir, 
las alarmas falsas (señales fuera de control incorrectas) se presentan rara vez, pero un cam¬ 
bio de A = 0.3 por lo general será detectado rápidamente. Con este valor de h, la primera 
señal fuera de control proviene después que se disponga de la muestra 13. Como 
d n = 1.17 > 0.95, parece que la media ha cambiado a un valor mayor que el objetivo. Es¬ 
te es el mismo mensaje que el proporcionado por la mascarilla V de la figura 16.9b). ■ 

Equivalencia de la mascarilla V 
y la forma computacional 

De nueva cuenta denote con r el punto actual de tiempo, de modo que 3c¡, x 2 , . . . , x r exis¬ 
ten. La figura 16.10 muestra una mascarilla V con el punto marcado como 0 en ( r, S r ). La 
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16.5 Procedimientos CUSUM 651 


Sr 


S r — h 
S r — h — k 
S-h-2k 



Pendiente k . 


r- 3 
r 



Figura 16.10 Mascarilla V con pendiente de brazo inferior = k. 



pendiente del brazo inferior, que se denote por k, es h/d. De este modo, los puntos sobre el 
brazo inferior arriba de r, r — 1, r — 2, . . . están a alturas S r — h, S r — h — k, S r — h — 2k, 
y así sucesivamente. 

El proceso está bajo control si todos los puntos caen o están entre los brazos de la 
mascarilla. Para describir esta condición algebraicamente, sea 

; 

T, = Z Dé,- - (/a 0 + £)] 1= 1,2,3,... ,r 

i= i 

Las condiciones bajo las que todos los puntos están sobre o arriba del brazo inferior son 
S r -)i< S r (trivialmente satisfecha), es decir, S r < S r + h 

S r — h — k < S r _ | es decir, S r < + h + k 

S r — h — 2k < S r _ 2 es decir, S r < 5 , ,._ 2 + h + 2k 



Ahora se resta rk de ambos lados de cada 
S r — rk < S r — rk + h 
S r ~rk<S r _j - (r- l)Jfc 
5,. - 5 r _ 2 - (r - 2)k 


desigualdad para obtener 

es decir, 7j < 7) + 
+ h es decir, T r < T r : 

+ h es decir, T r < 7j 2 


+ h 
+ h 


Entonces todos los puntos dibujados se encuentran sobre o arriba del brazo inferior si y só¬ 
lo si T r — T r < /z, T r — T r _ 1 < h,T r — T r _ 2 < /? y así sucesivamente. Esto es equivalente a 

7j. — mín(7j, T 2 , , T r ) < h 

De modo semejante, si se hace 

V r = í [x, - (M„ - *)] = S r + rk 
i= 1 
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652 CAPÍTULO 16 Métodos de control de calidad 

se puede demostrar que todos los puntos se encuentran sobre o abajo del brazo superior si 
y sólo si 

máx(Vj, . . . , V r ) - V r < h 

Si ahora se hace 

d r = T r — mín(7j, . . . , T r ) 
e r = máx(Vj, . . . ,V r ) ~V r 

se ve fácilmente que d v d 2 , . . . y e lt e 2 , . . . se pueden calcular de manera repetitiva como 
ya se ilustró aquí líneas antes. Por ejemplo, la expresión para d r se sigue de la consideración 
de dos casos: 

1. mínf/’j, ... ,T r ) = T r , de donde d r = 0 

2. mín(7j, . . . ,T r ) = mín(7j, . . . , T r _ x ), de modo que 

d r = T r — mín(7j, . . . , 7' r _ 1 ) 

= x r ~ (/r 0 + k) + T r _ l - mín(7j-- T r _¿ 

= x r ~ (/¿o + k) + d r _ j 

Como d r no puede ser negativa, es la mayor de estas dos cantidades. 

Diseño de un procedimiento CUSUM 

Denote con A el tamaño de un cambio en /i que ha de ser detectado rápidamente usando un 
procedimiento CUSUM.* Es práctica común hacer k = A/2. Ahora suponga que un experto 
en control de calidad especifica valores deseados de dos grandes magnitudes promedio de lote: 

1. ARL (magnitud promedio de lote) cuando el proceso está bajo control (¡± = /r 0 ). 

2. ARL (magnitud promedio de lote) cuando el proceso está fuera de control porque la me¬ 
dia ha cambiado en A(/u, = p 0 + A o bien ¡jl = ¡jl 0 — A). 

Una gráfica desarrollada por Kenneth Kemp (“The Use of Cumulative Sums for Sampling Ins- 
pection Schemes”, Applied Statistics, 1962: 23), llamada nomograma, se puede usar entonces 
para determinar valores de h y n que alcancen las magnitudes promedio de lote especificadas. 7 
Esta gráfica se muestra en la figura 16.11. El método para usar la gráfica se describe en el re¬ 
cuadro siguiente. El valor de cr debe ser conocido o se usa una estimación en su lugar. 



Uso del nomograma de Kemp 

1. Localice las ARL en las escalas bajo control y fuera de control. Enlace estos dos 
puntos con una recta. 

2. Observe en dónde la recta cruza la escala k' y despeje n usando la ecuación 

A/2 

k' = ——/= 
cr/vn 

A continuación redondee n hacia arriba al entero más próximo. 

3. Enlace el punto en la escala k' con el punto de la escala ARL bajo control usando 
una segunda recta y observe en dónde esta recta cruza la escala h'. Entonces 
h = (cr/\ r ñ) • h'. 


* Esto contrasta con la anotación previa, donde A representaba el número de desviaciones estándar por las que 
cambiaba ¡jl. 

t La palabra nomograma no es específica para esta gráfica; los nomogramas se usan para muchos otros fines. 
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1.2 


ARL bajo control 



r ioo 

1.1 

ARL fuera de control 


1.0 

f V 



i 2.5 r 

3.0 A 2 ' 0 

150 

0.9 

3.5 / 

200 


4 -0 - 2.5 


0.8 

4.5 

250 


5.0 

5.5 30 

300 

0.7 

6.0 

6.5 3.5 

350 


7.0 

400 

0.6 

8.0 4.0 

450 


9.0 

10.0 45 

500 

0.5 

5.0 

600 



700 

0.4 


800 



900 

0.3 


1000 

0.2 






Figura 16.11 El nomograma Kemp.* 

El valor h = 0.95 se usó en el ejemplo 16.9. En esa situación, se deduce que la ARL bajo 
control es 500 y la ARL fuera de control (para A = 0.3) es 7. 

Ejemplo 16.10 El valor objetivo para el diámetro del núcleo interior de una bomba hidráulica es 2.250 pul¬ 
gadas. Si la desviación estándar del diámetro del núcleo es cr = 0.004, ¿cuál procedimien¬ 
to CUSUM dará una ARL bajo control de 500 y una ARL de 5 cuando el diámetro medio 
del núcleo cambie en una cantidad de 0.003 pulgadas? 

Si se enlaza el punto 500 de una escala ARL bajo control con el punto 5 de la escala 
ARL fuera de control y se prolonga la recta a la escala k! de la extrema izquierda de la fi¬ 
gura 16.11, resulta A:' = 0.74. Por tanto, 

A/2 0.0015 /- 

k' = 0.74 = - 7 = = r = 0.375Vn 

cr/vn 0.004 /vn 

de modo que 

Vñ = -^-= 1.973 n = (1.973 ) 2 = 3.894 
0.375 

Por tanto, el procedimiento CUSUM debe estar basado en el tamaño muestral n = 4. Aho¬ 
ra, si se enlaza 0.74 en la escala k' con 500 en la escala ARL bajo control resulta h' = 3.2, 
de donde 

h = (cr/Vn) • (3.2) = (0.004/V4)(3.2) = 0.0064 
Resulta una señal fuera de control tan pronto como d r > 0.0064 o e r > 0.0064. ■ 


fuente: Kemp, Kenneth W., “The Use of Cumulative Sums for Sampling Inspection Schemes”, Applied Statistics, 
vol. XI, 1962: 23. Con permiso de Blackwell Publishing. 
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Se han examinado procedimientos CUSUM para controlar la ubicación de un proce¬ 
so. Existen también procedimientos CUSUM para controlar variaciones en procesos y para 
datos de atributos. Deberían consultarse las referencias del capítulo para ver información so¬ 
bre estos procedimientos. 


EJERCICIOS Sección 16.5 (27-30) 


27. Se supone que los recipientes de cierto tratamiento para fo¬ 
sas sépticas contienen 16 onzas de líquido. Se selecciona una 
muestra de cinco recipientes de la línea de producción, 
una vez por hora y se determina el contenido promedio de 
la muestra. Considere los siguientes resultados: 15.992, 
16.051, 16.066, 15.912, 16.030, 16.060, 15.982, 15.899, 
16.038, 16.074, 16.029, 15.935, 16.032, 15.960, 16.055. 
Usando A = 0.10 y h = 0.20, utilice la forma computacional 
del procedimiento CUSUM para investigar el comportamien¬ 
to de este proceso. 

28. El valor objetivo para el diámetro de cierto tipo de eje mo¬ 
tor es de 0.75 pulgadas. El tamaño del cambio en el diáme¬ 
tro promedio considerado importante a detectar es 0.002 
pulgadas. Haga una muestra de diámetros promedio para 
grupos sucesivos de n = 4 ejes como sigue: 0.7507, 0.7504, 


0.7492, 0.7501, 0.7503, 0.7510, 0.7490, 0.7497, 0.7488, 
0.7504, 0.7516, 0.7472, 0.7489, 0.7483, 0.7471, 0.7498, 
0.7460, 0.7482, 0.7470, 0.7493, 0.7462, 0.7481. Utilice 
la forma computacional del procedimiento CUSUM con 
h = 0.003 para ver si la media del proceso permaneció en 
su objetivo durante todo el tiempo de observación. 

29. La desviación estándar de cierta dimensión en una pieza de 
avión es de 0.005 cm. ¿Qué procedimiento CUSUM dará un 
ARL bajo control de 600 y una ARL fuera de control de 4 
cuando el valor medio de la dimensión cambia en 0.004 cm? 

30. Cuando la ARL (magnitud promedio de lote) corresponde a 
un cambio de una desviación estándar en la media de un 
proceso, ¿cuáles son las características del procedimiento 
CUSUM que tiene unas ARL de 250 y 4.8 para las condi¬ 
ciones bajo control y fuera de control, respectivamente? 



| 16.6 Muestreo de aceptación 

Es frecuente que las piezas que provienen de un proceso de producción se envíen a otra 
compañía o establecimiento comercial. Un grupo podría estar formado por todas las unida¬ 
des de un lote o turno de producción particular, en un contenedor de embarque de algún ti¬ 
po, enviado en respuesta a un pedido en particular, y así sucesivamente. El grupo de piezas 
suele recibir el nombre de lote, el remitente se conoce como productor y el destinatario del 
lote es el consumidor. Aquí el interés se centrará en situaciones en las que cada pieza es de¬ 
fectuosa o no defectuosa, con p denotando la proporción de unidades defectuosas del lote. 
Naturalmente que el consumidor desearía aceptar el lote sólo si el valor de p es pequeño. El 
muestreo de aceptación es la parte de la estadística aplicada que se refiere a métodos para 
determinar si el consumidor debería aceptar o rechazar un lote. 

Hasta hace poco tiempo, los especialistas consideraban que los procedimientos de grá¬ 
ficas de control y técnicas de muestreo de aceptación eran partes igualmente importantes de 
la metodología de control de calidad. Este ya no es el caso. La razón es que el uso de gráfi¬ 
cas de control y otras estrategias creadas en tiempos recientes ofrece la oportunidad de di¬ 
señar calidad en un producto, mientras que el muestreo de aceptación resuelve lo que ya se 
ha producido y no estipula ningún control directo sobre la calidad del proceso. Esto llevó al 
desaparecido experto en control de calidad, el norteamericano W. E. Deming, especialista 
importante a persuadir a los japoneses de hacer el mayor uso posible de la metodología de 
control de calidad, a razonar firmemente contra el uso del muestreo de aceptación en mu¬ 
chas situaciones. En un estilo semejante, el reciente libro de Ryan (vea la bibliografía del ca¬ 
pítulo) dedica varios capítulos a gráficas de control y menciona el muestreo de aceptación 
sólo de paso. Como reflejo de esto, se presenta aquí una breve introducción a conceptos bá¬ 
sicos. Se puede hallar más información en varias referencias de la bibliografía del capítulo. 
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16.6 Muestreo de aceptación 655 


Planes de un solo muestreo 

El tipo más claro de plan de muestreo de aceptación consiste en seleccionar una sola mues¬ 
tra aleatoria de tamaño n y a continuación rechazar el lote si el número de defectos en la 
muestra excede de un valor c crítico especificado. Denote con la variable aleatoria X el nú¬ 
mero de piezas defectuosas del lote y con A el evento de que el lote se acepta. Entonces 
P(A ) = P(X < c ) es una función de p; cuanto mayor sea el valor de p, menor será la proba¬ 
bilidad de aceptar el lote. 

Si el tamaño muestral n es grande con relación a N, P(A) se calcula usando la distri¬ 
bución hipergeométrica (el número de piezas defectuosas en el lote es Np): 


(Np) . (N(l - p) 

C C 

P(X <c) h(x\ n, Np, N) = X 

x=0 x=0 

Cuando n es pequeña en relación con N (la regla empírica sugerida previamente fue n < 0.05 N, 
pero algunos autores emplean la regla menos conservadora n < 0. IN), se puede usar la dis¬ 
tribución binomial: 



P(X 


C 

c) = b(x\ n, 

x=0 



p x ( 1 - p) n ~ x 


Por último, si P(A) es grande sólo cuando p es pequeña (esto depende del valor de c), se jus¬ 
tifica la aproximación Poisson a la distribución binomial: 


P(X 


C C 

c) ~ 2 p(x; np) = X 

x=0 x=0 


e np (np) x 
x! 


El comportamiento de un plan de muestreo se puede resumir muy bien si se dibuja P(A) 
como una función de p. Esa gráfica se denomina curva característica de operación (CO) 
para el plan. 


Considere el plan de muestreo con valor crítico c = 2 y tamaño muestral n = 50 y supon¬ 
ga que el tamaño N del lote excede de 1000, de modo que se puede usar la distribución bi¬ 
nomial. Esto da 


P(A) = P{X < 2) = (1 - p) 50 + 50p(l - p) 49 + 1255/7 2 (1 - p) 48 

La tabla siguiente muestra P(A ) para valores seleccionados de p y la correspondiente curva 
característica de operación se muestra en la figura 16.12. 



p 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

0.10 

0.12 

0.15 

P(A) 

0.986 

0.922 

0.811 

0.677 

0.541 

0.416 

0.311 

0.226 

0.161 

0.112 

0.051 

0.014 


La curva característica de operación para el plan del ejemplo 16.11 tiene P(A) cerca 
de 1 para p muy cercana a 0. No obstante, en numerosas aplicaciones un porcentaje de pie¬ 
zas defectuosas de 8% [para el que P(A) = 0.226] o incluso sólo 5% \P{A) = 0.541] sería 
considerado excesivo, en cuyo caso las probabilidades de aceptación son demasiado altas. 
Si se aumenta el valor crítico c y se mantiene n fija da por resultado un plan para el que PÍA) 
aumenta en cada p (excepto 0 y 1), de modo que la nueva curva característica de operación 
se encuentra arriba de la anterior. Esto es deseable para p cercana a 0 pero no para valores 
más grandes de p. Al mantener c constante mientras se aumenta n se obtiene una curva 
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característica de operación más baja, que está bien para p más grande pero no para p cerca¬ 
na a 0. Se desea una curva característica de operación que sea más alta para una p muy pe¬ 
queña y más baja para una p más grande. Esto se logra al aumentar n y ajustar c. 

P(A) 

1.0 — 

0.8 “ 

0.6 “ 

0.4 - 

0.2 - 

0.0 - 1 - 1 - 1 - 1 - 1 - 1 - ! - 1 - 1 - 1 - ! - 1 -- p 

0.02 0.04 0.06 0.08 0.10 0.12 

Figura 16.12 Curva característica de operación para plan de muestreo con c = 2, n = 50. ■ 


Diseño de un plan de una muestra 

Un plan de muestreo eficaz es aquel con las siguientes características: 

1. Tiene una alta probabilidad especificada de aceptar lotes que el productor considera que 
son de buena calidad. 

2. Tiene una baja probabilidad especificada de aceptar lotes que el consumidor considera 
que son de mala calidad. 

Un plan de este tipo se puede llevar a cabo si se procede como sigue. Se designan dos 
valores diferentes de p, uno para el que P(A) es un valor especificado cercano a 1 y el otro 
para el que P(A) es un valor especificado cercano a 0. Estos dos valores de p, p l y p 2 por 
ejemplo, reciben el nombre de nivel de calidad aceptable (NCA) y el porcentaje defec¬ 
tuoso de tolerancia del lote (PDTL). Esto es, se necesita un plan para el que 

1. P(A) = 1 — a cuando p = p¡ = NCA (a pequeña) 

2. P(A ) = ¡3 cuando p = p 2 = PDTL (¡3 pequeña) 

Esto es análogo a buscar un procedimiento de prueba con probabilidad a de error tipo I es¬ 
pecificado y probabilidad ¡3 de error tipo II especificado cuando se prueben hipótesis. Por 
ejemplo, se podría tener 

NCA = 0.01 a = 0.05 (P(A) = 0.95) 

PDTL = 0.045 /3 = 0.10 (P(A) = 0.10) 

Debido a que X es discreta, por lo general hay que contentarse con valores de n y c que apro¬ 
ximadamente satisfagan estas condiciones. 

La tabla 16.6 da información de la cual n y c se puedan determinar en el caso a = 
0.05,13 = 0.10. 
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Tabla 16.6 Factores para determinar nycpara un plan de una muestra con 
a = 0.05,/3 = 0.10 


c 

nPi 

nPi 

P 2 /P 1 

c 

«Pi 

nPi 

Pi/Pi 

0 

0.051 

2.30 

45.10 

8 

4.695 

12.99 

2.77 

i 

0.355 

3.89 

10.96 

9 

5.425 

14.21 

2.62 

2 

0.818 

5.32 

6.50 

10 

6.169 

15.41 

2.50 

3 

1.366 

6.68 

4.89 

11 

6.924 

16.60 

2.40 

4 

1.970 

7.99 

4.06 

12 

7.690 

17.78 

2.31 

5 

2.613 

9.28 

3.55 

13 

8.464 

18.86 

2.24 

6 

3.285 

10.53 

3.21 

14 

9.246 

20.13 

2.18 

7 

3.981 

11.77 

2.96 

15 

10.040 

21.29 

2.12 


Determine un plan para el que NCA = p t = 0.01 y PDTL = p 2 = 0.045. La razón entre p 2 
Y Pi es 


PDIL = p i= 0045 =4 
NCA Pl 0.01 

Este valor se encuentra entre la razón 4.89 dada en la tabla 16.6, para la que c = 3 y 4.06, 
para la que c = 4. Una vez que se seleccione uno de estos valores de c, n se puede determi¬ 
nar ya sea al dividir el valor np 1 de la tabla 16.6 entre Pl , o por medio de np 2 lp 2 . De esta 
manera cuatro planes diferentes (dos valores de c y uno por cada uno de los dos valores de n) 
dan aproximadamente el valor especificado de a y ¡3. Considere, por ejemplo, usar c = 3 y 

« £l= L366 = 

Pl 0.01 

Entonces 


a = 1 — P(X < 3 cuando p = Pl ) 

3 /J37\ 

= 1 - Z (0.01H0.99) 137 -* = 0.050 

x=o\ x I 

(la aproximación Poisson con A = 1.37 también da 0.050) y 

/3 = P(X < 3 cuando p = p 2 ) = 0.131 

El plan con c = 4yn determinada a partir de np 2 = 7.99 tiene n = 178, a = 0.034 y 
/3 = 0.094. El mayor tamaño muestral da por resultado un plan con a y (i menores que los 
correspondientes valores especificados. ■ 

El libro de Douglas Montgomery citado en la bibliografía del capítulo contiene una gráfica 
de la cual c y n se pueden determinar para cualquier a y /3 especificadas. 

Puede ocurrir que el número de piezas defectuosas de la muestra llegue a c + 1 antes 
que se hayan examinado todas las piezas. Por ejemplo, en el caso c = 3 y n = 137, puede 
ser que la pieza número 125 examinada sea la cuarta pieza defectuosa, de modo que no hay 
necesidad de examinar las 12 piezas restantes. No obstante, por lo general se recomienda 
examinar todas las piezas incluso cuando esto ocurra para obtener un historial de calidad de 
lote por lote, así como estimaciones de p en el tiempo. 
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Planes de muestreo doble 

En un plan de muestreo doble, se determina el número de piezas defectuosas x x de una 
muestra inicial de tamaño n r . Hay entonces tres cursos de acción posibles: aceptar de inme¬ 
diato el lote, rechazar de inmediato el lote, o tomar una segunda muestra de n 2 piezas y 
rechazar o aceptar el lote dependiendo del número total x¡ + x 2 de piezas defectuosas en las 
dos muestras. Además de los dos tamaños muéstrales, un plan específico está caracterizado 
por otros tres números: c¡, r¡ y c 2 como sigue: 

1. Rechazar el lote si x¡ > r l . 

2. Aceptar el lote si x l < c v 

3. Si Cj < x 1 < r v tomar una segunda muestra; entonces aceptar el lote si x t + x 2 < c 2 y 
rechazarlo de otro modo. 

Ejemplo 16.13 Considere el plan de muestreo doble con n l = 80, n 2 = 80, c x = 2, r x = 5 y c 2 = 6. De es¬ 
te modo, el lote será aceptado si 1) x¡ =0, 1 o 2; 2) x¡ = 3 y x 2 = 0, 1, 2 o 3; o 3) x l =4 
y x 2 = 0, 1 o 2. 

Suponiendo que el tamaño del lote es grande lo suficiente para que aplique la aproxi¬ 
mación binomial, la probabilidad P(A) de aceptar el lote es 

P(A) = P(X l = 0, 1 o 2) + P(X l = 3, X 2 = 0, 1, 2 o 3) 

+ P(X x = 4, X 2 = 0, 1 o 2) 

2 3 

= 'Z Kx{, 80, p) + b( 3; 80, p) Z b(x 2 , 80, p) 

Xl = 0 X2 — 0 

2 

+ b( 4; 80, p) Z b(x 2 ; 80, p) 

X2=0 

De nuevo la gráfica de P(A) en función de p es la curva característica de operación del plan. 
La curva característica de operación para este plan aparece en la figura 16.13. 



P(A) 

1.0 ‘ 

0.9 - 
0.8 - 
0.7 - 
0.6 - 
0.5 - 
0.4 - 
0.3 - 
0.2 - 
0.1 - 

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 ^ P 

Figura 16.13 Curva característica de operación para el plan de muestreo doble del ejemplo 16.13. 


Un método común para diseñar un plan de muestreo doble consiste en proceder como 
se sugirió líneas antes para planes de una sola muestra. Especifique valores p x y p 2 junto con 
sus correspondientes probabilidades de aceptación 1 — a y ¡3. A continuación encuentre un 
plan que satisfaga estas condiciones. El libro de Montgomery contiene tablas semejantes a 
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16.6 Muestreo de aceptación 659 

la tabla 16.6 para este propósito en los casos n 2 = n l y n 2 = 2n ] con 1 — a = 0.95, /3 = 0.10. 
En otras fuentes se pueden hallar tabulaciones de planes mucho más extensas. 

De modo análogo a la práctica común con planes de una sola muestra, se recomienda 
que todas las piezas de la primera muestra sean examinadas incluso cuando la (r¡ + 1) pie¬ 
za defectuosa se descubra antes de inspeccionar la «,-ésima muestra. No obstante, se acos¬ 
tumbra terminar la inspección de la segunda muestra si el número de piezas defectuosas es 
suficiente para justificar el rechazo antes que se hayan examinado todas las piezas. Esto se 
conoce como acortamiento en la segunda muestra. Con el acortamiento, se puede demos¬ 
trar que el número esperado de piezas inspeccionadas, en un plan de muestreo doble, es me¬ 
nor que el número de piezas examinadas en un plan de muestreo de una sola pieza, cuando 
las curvas características de operación de los dos planes están cerca de ser idénticas. Esta 
es la principal virtud de planes de muestreo doble. Para saber más de estos temas, así como 
de un examen de planes de muestreo secuenciales y múltiples (que consisten en seleccionar 
artículos para inspección uno por uno en lugar de en grupos), debe consultarse un libro que 
hable de control de calidad. 

Rectificación de inspección y otros criterios de diseño 

En algunas situaciones, una inspección de muestreo se lleva a cabo mediante rectificación. 
Para planes de una sola muestra, esto significa que cada pieza defectuosa de la muestra se 
sustituye con una satisfactoria y si el número de piezas defectuosas de la muestra excede del 
corte c de aceptación, todas las piezas del lote son examinadas y con piezas buenas 
se sustituye cualquiera de las defectuosas. Denótese con N el tamaño del lote. Una caracte¬ 
rística importante de un plan de muestreo con rectificación de inspección es la calidad de 
salida promedio, denotada por CSP. Esta es la proporción a largo plazo de piezas defec¬ 
tuosas entre las enviadas después de que se utiliza el plan de muestreo. Ahora las piezas de¬ 
fectuosas se presentarán sólo entre las N — n piezas no inspeccionadas de un lote juzgado 
aceptable con base en una muestra. Supóngase por ejemplo, que P(A ) = P(X < c) = 0.985 
cuando p = 0.01. Entonces, a largo plazo, 98.5% de las N — n piezas que no estén en 
la muestra no se inspeccionarán, de las que se espera que 1% sean defectuosas. Esto impli¬ 
ca que el número esperado de piezas defectuosas de un lote seleccionado al azar sea 
(N — n) • P(A) • p = 0.00985(A — n). Si se divide esto entre el número de piezas de un lo¬ 
te resulta la calidad de salida promedio: 

csp = {N ~ n) • P(A) • p 
N 

~ P(A) • p si N » n 

Debido a que CSP = 0 cuando p = 0 o cuando p = 1 \P(A) = 0 en el último caso], se de¬ 
duce que hay un valor de p entre 0 y 1 para el cual CSP es máxima. El valor máximo de CSP 
se denomina límite de calidad de salida promedio, LCSP. Por ejemplo, para el plan con 
n = 137 y c = 3 examinado líneas antes, LCSP = 0.0142, el valor de CSP en p ~ 0.02. 

Las selecciones apropiadas de n y c darán un plan de muestreo para el que LCSP es 
un número especificado pequeño. No obstante, este plan no es único y se pueden imponer 
otras condiciones. Es frecuente que esta segunda condición comprenda el promedio (es de¬ 
cir, esperado) del número total inspeccionado, denotado por NTI. El número de piezas 
inspeccionadas de un lote seleccionado al azar es una variable aleatoria que toma el valor n 
con probabilidad P(A) y Acón probabilidad 1 — P(A). Por tanto, el número esperado de pie¬ 
zas inspeccionadas de un lote seleccionado al azar es 

NTI = n • P(A) + N • (1 - P(A)) 

Es práctica común seleccionar un plan de muestreo que tenga un límite de calidad de sali¬ 
da promedio (LCSP) y, además, el promedio mínimo del número total inspeccionado (NTI) 
a un nivel de calidad particular p. 
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660 CAPITULO 16 Métodos de control de calidad 

Planes de muestro estándar 

Puede parecer como si la determinación de un plan de muestreo que simultáneamente satis¬ 
faga varios criterios fuera muy difícil. Por fortuna, ya otros investigadores han puesto las ba¬ 
ses en forma de extensas tabulaciones de esos planes. MIL STD 105D, creado por las 
fuerzas militares después de la Segunda Guerra Mundial, es el conjunto de planes de más 
amplio uso. Una versión civil, ANSI/ASQC Z1.4, es muy semejante a la versión militar. Un 
tercer conjunto de planes que goza de preferencia fue creado por los Laboratorios Bell antes 
de la Segunda Guerra Mundial por dos expertos en estadística, Dodge y Romig. El libro de 
Montgomery (vea la bibliografía del capítulo) contiene una amena introducción al uso 
de estos planes. 


EJERCICIOS Sección 16.6 (31-38) 


31. Considere el plan de una sola muestra con c = 2 y n = 50, 
como se vio en el ejemplo 16.11, pero ahora suponga que el 
tamaño del lote es N = 500. Calcule P{A), la probabilidad 3 g_ 
de aceptar el lote, para p = 0.01, 0.02, . . . , 0.10 usando la 
distribución hipergeométrica. ¿La aproximación binomial da 
resultados satisfactorios en este caso? 

32 . Ha de seleccionarse una muestra de 50 piezas de un lote 
formado por 5000 piezas. El lote será aceptado si la mues¬ 
tra contiene una pieza defectuosa, a lo sumo. Calcule la pro¬ 
babilidad de aceptación del lote para p = 0.01, 0.02, . . . , 

0.10 y trace la curva característica de operación. 

33 . Consulte el ejercicio 32 y considere el plan con n = 100 y 
c = 2. Calcule P(A ) para p = 0.01, 0.02, . . . , 0.05 y trace 
las dos curvas características de operación en el mismo con¬ 
junto de ejes. ¿Cuál de los dos planes es preferible (dejan¬ 
do de lado el costo del muestreo) y por qué? 

34 . Elabore un plan de una sola muestra para el que el nivel de 
caída aceptable = .02 y el porcentaje defectuoso de toleran¬ 
cia del lote = 0.07 en el caso a = 0.05, j8 = 0.10. Una vez 
que los valores denyc se hayan determinado, calcule los 
valores alcanzados de a y j3 para el plan. 

35 . Considere el plan de muestreo doble para el cual ambos ta¬ 
maños muéstrales son de 50. El lote es aceptado después de 
la primera muestra si el número de piezas defectuosas es 1 a 
lo sumo, rechazado si el número de piezas defectuosas es al 
menos 4 y rechazado después de la segunda muestra si el 


número total de piezas defectuosas es 6 o más. Calcule la 
probabilidad de aceptar el lote cuando p = 0.01, 0.05 y 0.10. 
Algunas fuentes están a favor de un tipo un poco más res¬ 
trictivo de plan de muestreo doble en el que j-¡ = c 2 + 1 ; es 
decir, el lote es rechazado si en cualquiera de las etapas 
el número (total) de piezas defectuosas es al menos r x (vea el 
libro de Montgomery). Considere este tipo de plan de mues¬ 
treo con /q = 50, n-, = 100, c x = 1 y r x = 4. Calcule la pro¬ 
babilidad de aceptación del lote cuando p = 0.02, 0.05 y 
0 . 10 . 

37. Consulte el ejemplo 16.11, en el que se utilizó un plan de 
una sola muestra con n = 50 y c = 2. 

a. Calcule la calidad de salida promedio para p = 0.01, 
0.02, . . . , 0.10. ¿Qué sugiere esto acerca del valor de p 
para el que la calidad de salida promedio es máxima y el 
correspondiente límite de calidad de salida promedio? 

b. Determine el valor de p para el que la calidad de salida 
promedio sea máxima y el valor correspondiente de 
LCSP. [Sugerencia: Use cálculo.] 

c. Para N = 2000, calcule el promedio del número total ins¬ 
peccionado para los valores de p dados en el inciso a. 

38. Considere el plan de una sola muestra que utiliza n = 50 y 
c = 1 cuando N = 2000. Determine los valores de la cali¬ 
dad de salida promedio y el promedio del número total ins¬ 
peccionado para valores seleccionados de p y grafique cada 
uno de éstos contra p. También determine el valor del lími¬ 
te de calidad de salida promedio. 



EJERCICIOS SUPLEMENTARIOS (39-44) 


39 . Observaciones realizadas en la resistencia al corte de 26 
subgrupos de soldadura eléctrica por puntos de prueba, ca¬ 
da uno formado por seis soldaduras, producen 2A¡ = 
10 980, Y.s¡ — 402 y Y.r¡ = 1074. Calcule límites de control 
para cualquier gráfica de control relevante. 

40 . Se determina el número de arañazos en la superficie de ca¬ 
da una de 24 placas metálicas rectangulares, dando la si¬ 
guiente información: 8, 1, 7, 5, 2, 0, 2, 3, 4, 3, 1, 2, 5, 7, 3, 


4, 6, 5, 2, 4, 0, 10, 2, 6. Construya una gráfica de control 
apropiada y comente. 

41 . Los siguientes números son observaciones sobre resistencia 
a la tensión de especímenes de tela sintética seleccionados 
de un proceso de producción a intervalos igualmente espa¬ 
ciados. Construya gráficas de control apropiadas y comen¬ 
te (suponga que una causa asignable es identificable para 
cualesquiera observaciones fuera de control). 
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1 . 

51.3 

51.7 

49.5 

12. 49.6 

48.4 

50.0 

2. 

51.0 

50.0 

49.3 

13. 49.8 

51.2 

49.7 

3. 

50.8 

51.1 

49.0 

14. 50.4 

49.9 

50.7 

4. 

50.6 

51.1 

49.0 

15. 49.4 

49.5 

49.0 

5. 

49.6 

50.5 

50.9 

16. 50.7 

49.0 

50.0 

6. 

51.3 

52.0 

50.3 

17. 50.8 

49.5 

50.9 

7. 

49.7 

50.5 

50.3 

18. 48.5 

50.3 

49.3 

8. 

51.8 

50.3 

50.0 

19. 49.6 

50.6 

49.4 

9. 

48.6 

50.5 

50.7 

20. 50.9 

49.4 

49.7 

10. 

49.6 

49.8 

50.5 

21. 54.1 

49.8 

48.5 

11. 

49.9 

50.7 

49.8 

22. 50.2 

49.6 

51.5 


42. Una alternativa de la gráfica p para la fracción defectuosa es 
la gráfica np para el número de piezas defectuos as. Esta grá- 
fica tiene límite superior de control = np + 3Vnp(l — p), 
límite inferior de control = np — 3 V np( I — p) y el núme¬ 
ro de piezas defectuosas de cada muestra se determina en la 
gráfica. Construya esa gráfica para los datos del ejemplo 
16.6. ¿El uso de una gráfica np siempre da el mismo men¬ 
saje que el uso de una gráfica p (es decir, las dos gráficas 
son equivalentes)? 

43. Observaciones de resistencia (ohms) para subgrupos de 
cierto tipo de registro dieron en resumen las siguientes can¬ 
tidades: 


i 

", 

*¡ 


i 

", 


S i 

1 

4 

430.0 

22.5 

7 

4 

420.8 

25.4 

2 

4 

418.2 

20.6 

8 

4 

431.4 

24.0 

3 

3 

435.5 

25.1 

9 

4 

428.7 

21.2 

4 

4 

427.6 

22.3 

10 

4 

440.1 

25.8 

5 

4 

444.0 

21.5 

11 

4 

445.2 

27.3 

6 

3 

431.4 

28.9 

12 

4 

430.1 

22.2 
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i 

", 


•s¡ 

i 

", 



13 

4 

427.2 

24.0 

17 

3 

447.0 

19.8 

14 

4 

439.6 

23.3 

18 

4 

434.4 

23.7 

15 

3 

415.9 

31.2 

19 

4 

422.2 

25.1 

16 

4 

419.8 

27.5 

20 

4 

425.7 

24.4 


Construya límites de control apropiados. [Sugerencia: Use 
x = 'Zn i x/Zn ¡ y s 2 = ~Z(n¡ - 1 )s 2 i ¡Z(n i - 1).] 

44. Sea a el número entre 0 y 1 y defina una secuencia W lt W 2 , 
W 2 , . . . por W ü = p y W, = aX t + (1 — a)W r _ 1 para t = 1, 
2, ... . Sustituyendo por W f _ I su representación en términos 
de X,_j y W t _ 2 , luego sustituyendo por W t _ 2 y así sucesiva¬ 
mente, da por resultado 

W, = aX, + a(l - a)X,_ l + ■ ■ ■ 

+ a( 1 - + (1 - a)'p 

El hecho que W, depende no sólo de X t sino también de pro¬ 
medios para puntos de tiempo pasado, aunque con pesos 
(exponencialmente) decrecientes, sugiere que cambios en la 
media del proceso se reflejarán con más rapidez en las W, 
que en las X t individuales. 

a. Demuestre que E{W t ) = p. 

b. Sea cr 2 = V( W t ) y demuestre que 

i _ a[ 1 — (1 — a) 2 '] a 1 
' 2 — a n 

c. Una gráfica de control de promedio móvil ponderada 
exponencialmente determina las W t y utiliza límites de 
control p 0 ± 3<x, (o bien, x en lugar de p 0 ). Construya 
una gráfica de este tipo para la información del ejemplo 
16.9, usando p 0 = 40. 
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664 Apéndice/Tablas 

Tabla A.1 Distribuciones binomiales acumulativas 

a. n = 5 


X 

B(x\ n, p) = X b{y\ n, p) 

y=0 


P 



0.01 

0.05 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.951 

0.774 

0.590 

0.328 

0.237 

0.168 

0.078 

0.031 

0.010 

0.002 

0.001 

0.000 

0.000 

0.000 

0.000 

1 

0.999 

0.977 

0.919 

0.737 

0.633 

0.528 

0.337 

0.188 

0.087 

0.031 

0.016 

0.007 

0.000 

0.000 

0.000 

x 2 

1.000 

0.999 

0.991 

0.942 

0.896 

0.837 

0.683 

0.500 

0.317 

0.163 

0.104 

0.058 

0.009 

0.001 

0.000 

3 

1.000 

1.000 

1.000 

0.993 

0.984 

0.969 

0.913 

0.812 

0.663 

0.472 

0.367 

0.263 

0.081 

0.023 

0.001 

4 

1.000 

1.000 

1.000 

1.000 

0.999 

0.998 

0.990 

0.969 

0.922 

0.832 

0.763 

0.672 

0.410 

0.226 

0.049 


b. n = 10 


P 



0.01 

0.05 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.904 

0.599 

0.349 

0.107 

0.056 

0.028 

0.006 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

1 

0.996 

0.914 

0.736 

0.376 

0.244 

0.149 

0.046 

0.011 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

2 

1.000 

0.988 

0.930 

0.678 

0.526 

0.383 

0.167 

0.055 

0.012 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

3 

1.000 

0.999 

0.987 

0.879 

0.776 

0.650 

0.382 

0.172 

0.055 

0.011 

0.004 

0.001 

0.000 

0.000 

0.000 

4 

1.000 

1.000 

0.998 

0.967 

0.922 

0.850 

0.633 

0.377 

0.166 

0.047 

0.020 

0.006 

0.000 

0.000 

0.000 

5 

1.000 

1.000 

1.000 

0.994 

0.980 

0.953 

0.834 

0.623 

0.367 

0.150 

0.078 

0.033 

0.002 

0.000 

0.000 

6 

1.000 

1.000 

1.000 

0.999 

0.996 

0.989 

0.945 

0.828 

0.618 

0.350 

0.224 

0.121 

0.013 

0.001 

0.000 

7 

1.000 

1.000 

1.000 

1.000 

1.000 

0.998 

0.988 

0.945 

0.833 

0.617 

0.474 

0.322 

0.070 

0.012 

0.000 

8 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.998 

0.989 

0.954 

0.851 

0.756 

0.624 

0.264 

0.086 

0.004 

9 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.999 

0.994 

0.972 

0.944 

0.893 

0.651 

0.401 

0.096 


c. n = 15 


P 



0.01 

0.05 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.860 

0.463 

0.206 

0.035 

0.013 

0.005 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

1 

0.990 

0.829 

0.549 

0.167 

0.080 

0.035 

0.005 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

2 

1.000 

0.964 

0.816 

0.398 

0.236 

0.127 

0.027 

0.004 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

3 

1.000 

0.995 

0.944 

0.648 

0.461 

0.297 

0.091 

0.018 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

4 

1.000 

0.999 

0.987 

0.836 

0.686 

0.515 

0.217 

0.059 

0.009 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

5 

1.000 

1.000 

0.998 

0.939 

0.852 

0.722 

0.402 

0.151 

0.034 

0.004 

0.001 

0.000 

0.000 

0.000 

0.000 

6 

1.000 

1.000 

1.000 

0.982 

0.943 

0.869 

0.610 

0.304 

0.095 

0.015 

0.004 

0.001 

0.000 

0.000 

0.000 

x 7 

1.000 

1.000 

1.000 

0.996 

0.983 

0.950 

0.787 

0.500 

0.213 

0.050 

0.017 

0.004 

0.000 

0.000 

0.000 

8 

1.000 

1.000 

1.000 

0.999 

0.996 

0.985 

0.905 

0.696 

0.390 

0.131 

0.057 

0.018 

0.000 

0.000 

0.000 

9 

1.000 

1.000 

1.000 

1.000 

0.999 

0.996 

0.966 

0.849 

0.597 

0.278 

0.148 

0.061 

0.002 

0.000 

0.000 

10 

1.000 

1.000 

1.000 

1.000 

1.000 

0.999 

0.991 

0.941 

0.783 

0.485 

0.314 

0.164 

0.013 

0.001 

0.000 

11 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.998 

0.982 

0.909 

0.703 

0.539 

0.352 

0.056 

0.005 

0.000 

12 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.996 

0.973 

0.873 

0.764 

0.602 

0.184 

0.036 

0.000 

13 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.995 

0.965 

0.920 

0.833 

0.451 

0.171 

0.010 

14 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.995 

0.987 

0.965 

0.794 

0.537 

0.140 


(i continúa) 
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Tabla A.1 Distribuciones binomiales acumulativas (continuación) * 

d n _ 20 n, p) = Z My\ n, p) 

y=0 

p 



0.01 

0.05 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.818 

0.358 

0.122 

0.012 

0.003 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

1 

0.983 

0.736 

0.392 

0.069 

0.024 

0.008 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

2 

0.999 

0.925 

0.677 

0.206 

0.091 

0.035 

0.004 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

3 

1.000 

0.984 

0.867 

0.411 

0.225 

0.107 

0.016 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

4 

1.000 

0.997 

0.957 

0.630 

0.415 

0.238 

0.051 

0.006 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

5 

1.000 

1.000 

0.989 

0.804 

0.617 

0.416 

0.126 

0.021 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

6 

1.000 

1.000 

0.998 

0.913 

0.786 

0.608 

0.250 

0.058 

0.006 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

7 

1.000 

1.000 

1.000 

0.968 

0.898 

0.772 

0.416 

0.132 

0.021 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

8 

1.000 

1.000 

1.000 

0.990 

0.959 

0.887 

0.596 

0.252 

0.057 

0.005 

0.001 

0.000 

0.000 

0.000 

0.000 

9 

1.000 

1.000 

1.000 

0.997 

0.986 

0.952 

0.755 

0.412 

0.128 

0.017 

0.004 

0.001 

0.000 

0.000 

0.000 

10 

1.000 

1.000 

1.000 

0.999 

0.996 

0.983 

0.872 

0.588 

0.245 

0.048 

0.014 

0.003 

0.000 

0.000 

0.000 

11 

1.000 

1.000 

1.000 

1.000 

0.999 

0.995 

0.943 

0.748 

0.404 

0.113 

0.041 

0.010 

0.000 

0.000 

0.000 

12 

1.000 

1.000 

1.000 

1.000 

1.000 

0.999 

0.979 

0.868 

0.584 

0.228 

0.102 

0.032 

0.000 

0.000 

0.000 

13 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.994 

0.942 

0.750 

0.392 

0.214 

0.087 

0.002 

0.000 

0.000 

14 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.998 

0.979 

0.874 

0.584 

0.383 

0.196 

0.011 

0.000 

0.000 

15 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.994 

0.949 

0.762 

0.585 

0.370 

0.043 

0.003 

0.000 

16 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.999 

0.984 

0.893 

0.775 

0.589 

0.133 

0.016 

0.000 

17 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.996 

0.965 

0.909 

0.794 

0.323 

0.075 

0.001 

18 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.999 

0.992 

0.976 

0.931 

0.608 

0.264 

0.017 

19 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.999 

0.997 

0.988 

0.878 

0.642 

0.182 


( continúa) 
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x 

B(x\ n, p ) = X My, n, p) 

y=0 


P 



0.01 

0.05 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.778 

0.277 

0.072 

0.004 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

1 

0.974 

0.642 

0.271 

0.027 

0.007 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

2 

0.998 

0.873 

0.537 

0.098 

0.032 

0.009 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

3 

1.000 

0.966 

0.764 

0.234 

0.096 

0.033 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

4 

1.000 

0.993 

0.902 

0.421 

0.214 

0.090 

0.009 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

5 

1.000 

0.999 

0.967 

0.617 

0.378 

0.193 

0.029 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

6 

1.000 

1.000 

0.991 

0.780 

0.561 

0.341 

0.074 

0.007 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

7 

1.000 

1.000 

0.998 

0.891 

0.727 

0.512 

0.154 

0.022 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

8 

1.000 

1.000 

1.000 

0.953 

0.851 

0.677 

0.274 

0.054 

0.004 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

9 

1.000 

1.000 

1.000 

0.983 

0.929 

0.811 

0.425 

0.115 

0.013 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

10 

1.000 

1.000 

1.000 

0.994 

0.970 

0.902 

0.586 

0.212 

0.034 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

11 

1.000 

1.000 

1.000 

0.998 

0.980 

0.956 

0.732 

0.345 

0.078 

0.006 

0.001 

0.000 

0.000 

0.000 

0.000 

x 12 

1.000 

1.000 

1.000 

1.000 

0.997 

0.983 

0.846 

0.500 

0.154 

0.017 

0.003 

0.000 

0.000 

0.000 

0.000 

13 

1.000 

1.000 

1.000 

1.000 

0.999 

0.994 

0.922 

0.655 

0.268 

0.044 

0.020 

0.002 

0.000 

0.000 

0.000 

14 

1.000 

1.000 

1.000 

1.000 

1.000 

0.998 

0.966 

0.788 

0.414 

0.098 

0.030 

0.006 

0.000 

0.000 

0.000 

15 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.987 

0.885 

0.575 

0.189 

0.071 

0.017 

0.000 

0.000 

0.000 

16 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.996 

0.946 

0.726 

0.323 

0.149 

0.047 

0.000 

0.000 

0.000 

17 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.999 

0.978 

0.846 

0.488 

0.273 

0.109 

0.002 

0.000 

0.000 

18 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.993 

0.926 

0.659 

0.439 

0.220 

0.009 

0.000 

0.000 

19 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.998 

0.971 

0.807 

0.622 

0.383 

0.033 

0.001 

0.000 

20 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.991 

0.910 

0.786 

0.579 

0.098 

0.007 

0.000 

21 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.998 

0.967 

0.904 

0.766 

0.236 

0.034 

0.000 

22 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.991 

0.968 

0.902 

0.463 

0.127 

0.002 

23 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.998 

0.993 

0.973 

0.729 

0.358 

0.026 

24 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

0.999 

0.996 

0.928 

0.723 

0.222 
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Tabla A.1 Distribuciones binomiales acumulativas (continuación) 

e. n = 25 


Tabla A.2 Distribuciones acumulativas de Poisson 


A 


F(x; A) 


y e A A - V 

y =o y ! 



0.1 

0.2 

0.3 

0.4 

0.5 

0.6 

0.7 

0.8 

0.9 

1.0 

0 

0.905 

0.819 

0.741 

0.670 

0.607 

0.549 

0.497 

0.449 

0.407 

0.368 

1 

0.995 

0.982 

0.963 

0.938 

0.910 

0.878 

0.844 

0.809 

0.772 

0.736 

2 

1.000 

0.999 

0.996 

0.992 

0.986 

0.977 

0.966 

0.953 

0.937 

0.920 

x 3 


1.000 

1.000 

0.999 

0.998 

0.997 

0.994 

0.991 

0.987 

0.981 

4 




1.000 

1.000 

1.000 

0.999 

0.999 

0.998 

0.996 

5 







1.000 

1.000 

1.000 

0.999 

6 










1.000 


(< continúa) 
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Tabla A.2 Distribuciones acumulativas de Poisson (continuación) 


F(x- A) = £ 


667 

e -A A- v 




y=0 r- 








A 






2.0 

3.0 

4.0 

5.0 

6.0 

7.0 

8.0 

9.0 

10.0 

15.0 

20.0 

0 

0.135 

0.050 

0.018 

0.007 

0.002 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

1 

0.406 

0.199 

0.092 

0.040 

0.017 

0.007 

0.003 

0.001 

0.000 

0.000 

0.000 

2 

0.677 

0.423 

0.238 

0.125 

0.062 

0.030 

0.014 

0.006 

0.003 

0.000 

0.000 

3 

0.857 

0.647 

0.433 

0.265 

0.151 

0.082 

0.042 

0.021 

0.010 

0.000 

0.000 

4 

0.947 

0.815 

0.629 

0.440 

0.285 

0.173 

0.100 

0.055 

0.029 

0.001 

0.000 

5 

0.983 

0.916 

0.785 

0.616 

0.446 

0.301 

0.191 

0.116 

0.067 

0.003 

0.000 

6 

0.995 

0.966 

0.889 

0.762 

0.606 

0.450 

0.313 

0.207 

0.130 

0.008 

0.000 

7 

0.999 

0.988 

0.949 

0.867 

0.744 

0.599 

0.453 

0.324 

0.220 

0.018 

0.001 

8 

1.000 

0.996 

0.979 

0.932 

0.847 

0.729 

0.593 

0.456 

0.333 

0.037 

0.002 

9 


0.999 

0.992 

0.968 

0.916 

0.830 

0.717 

0.587 

0.458 

0.070 

0.005 

10 


1.000 

0.997 

0.986 

0.957 

0.901 

0.816 

0.706 

0.583 

0.118 

0.011 

11 



0.999 

0.995 

0.980 

0.947 

0.888 

0.803 

0.697 

0.185 

0.021 

12 



1.000 

0.998 

0.991 

0.973 

0.936 

0.876 

0.792 

0.268 

0.039 

13 




0.999 

0.996 

0.987 

0.966 

0.926 

0.864 

0.363 

0.066 

14 




1.000 

0.999 

0.994 

0.983 

0.959 

0.917 

0.466 

0.105 

15 





0.999 

0.998 

0.992 

0.978 

0.951 

0.568 

0.157 

16 





1.000 

0.999 

0.996 

0.989 

0.973 

0.664 

0.221 

17 






1.000 

0.998 

0.995 

0.986 

0.749 

0.297 

18 







0.999 

0.998 

0.993 

0.819 

0.381 

* 19 







1.000 

0.999 

0.997 

0.875 

0.470 

20 








1.000 

0.998 

0.917 

0.559 

21 









0.999 

0.947 

0.644 

22 









1.000 

0.967 

0.721 

23 










0.981 

0.787 

24 










0.989 

0.843 

25 










0.994 

0.888 

26 










0.997 

0.922 

27 










0.998 

0.948 

28 










0.999 

.966 

29 










1.000 

0.978 

30 











0.987 

31 











0.992 

32 











0.995 

33 











0.997 

34 











0.999 

35 











0.999 

36 











1.000 


-e- 
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Tabla A.3 Áreas de la Curva normal estándar a>(z) = p(zs Z ) 

Función de densidad normal estándar 



z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

-3.4 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0002 

-3.3 

0.0005 

0.0005 

0.0005 

0.0004 

0.0004 

0.0004 

0.0004 

0.0004 

0.0004 

0.0003 

-3.2 

0.0007 

0.0007 

0.0006 

0.0006 

0.0006 

0.0006 

0.0006 

0.0005 

0.0005 

0.0005 

-3.1 

0.0010 

0.0009 

0.0009 

0.0009 

0.0008 

0.0008 

0.0008 

0.0008 

0.0007 

0.0007 

-3.0 

0.0013 

0.0013 

0.0013 

0.0012 

0.0012 

0.0011 

0.0011 

0.0011 

0.0010 

0.0010 

-2.9 

0.0019 

0.0018 

0.0017 

0.0017 

0.0016 

0.0016 

0.0015 

0.0015 

0.0014 

0.0014 

-2.8 

0.0026 

0.0025 

0.0024 

0.0023 

0.0023 

0.0022 

0.0021 

0.0021 

0.0020 

0.0019 

-2.7 

0.0035 

0.0034 

0.0033 

0.0032 

0.0031 

0.0030 

0.0029 

0.0028 

0.0027 

0.0026 

-2.6 

0.0047 

0.0045 

0.0044 

0.0043 

0.0041 

0.0040 

0.0039 

0.0038 

0.0037 

0.0036 

-2.5 

0.0062 

0.0060 

0.0059 

0.0057 

0.0055 

0.0054 

0.0052 

0.0051 

0.0049 

0.0038 

-2.4 

0.0082 

0.0080 

0.0078 

0.0075 

0.0073 

0.0071 

0.0069 

0.0068 

0.0066 

0.0064 

-2.3 

0.0107 

0.0104 

0.0102 

0.0099 

0.0096 

0.0094 

0.0091 

0.0089 

0.0087 

0.0084 

-2.2 

0.0139 

0.0136 

0.0132 

0.0129 

0.0125 

0.0122 

0.0119 

0.0116 

0.0113 

0.0110 

-2.1 

0.0179 

0.0174 

0.0170 

0.0166 

0.0162 

0.0158 

0.0154 

0.0150 

0.0146 

0.0143 

-2.0 

0.0228 

0.0222 

0.0217 

0.0212 

0.0207 

0.0202 

0.0197 

0.0192 

0.0188 

0.0183 

-1.9 

0.0287 

0.0281 

0.0274 

0.0268 

0.0262 

0.0256 

0.0250 

0.0244 

0.0239 

0.0233 

-1.8 

0.0359 

0.0352 

0.0344 

0.0336 

0.0329 

0.0322 

0.0314 

0.0307 

0.0301 

0.0294 

-1.7 

0.0446 

0.0436 

0.0427 

0.0418 

0.0409 

0.0401 

0.0392 

0.0384 

0.0375 

0.0367 

-1.6 

0.0548 

0.0537 

0.0526 

0.0516 

0.0505 

0.0495 

0.0485 

0.0475 

0.0465 

0.0455 

-1.5 

0.0668 

0.0655 

0.0643 

0.0630 

0.0618 

0.0606 

0.0594 

0.0582 

0.0571 

0.0559 

-1.4 

0.0808 

0.0793 

0.0778 

0.0764 

0.0749 

0.0735 

0.0722 

0.0708 

0.0694 

0.0681 

-1.3 

0.0968 

0.0951 

0.0934 

0.0918 

0.0901 

0.0885 

0.0869 

0.0853 

0.0838 

0.0823 

-1.2 

0.1151 

0.1131 

0.1112 

0.1093 

0.1075 

0.1056 

0.1038 

0.1020 

0.1003 

0.0985 

-1.1 

0.1357 

0.1335 

0.1314 

0.1292 

0.1271 

0.1251 

0.1230 

0.1210 

0.1190 

0.1170 

-1.0 

0.1587 

0.1562 

0.1539 

0.1515 

0.1492 

0.1469 

0.1446 

0.1423 

0.1401 

0.1379 

-0.9 

0.1841 

0.1814 

0.1788 

0.1762 

0.1736 

0.1711 

0.1685 

0.1660 

0.1635 

0.1611 

-0.8 

0.2119 

0.2090 

0.2061 

0.2033 

0.2005 

0.1977 

0.1949 

0.1922 

0.1894 

0.1867 

-0.7 

0.2420 

0.2389 

0.2358 

0.2327 

0.2296 

0.2266 

0.2236 

0.2206 

0.2177 

0.2148 

-0.6 

0.2743 

0.2709 

0.2676 

0.2643 

0.2611 

0.2578 

0.2546 

0.2514 

0.2483 

0.2451 

-0.5 

0.3085 

0.3050 

0.3015 

0.2981 

0.2946 

0.2912 

0.2877 

0.2843 

0.2810 

0.2776 

-0.4 

0.3446 

0.3409 

0.3372 

0.3336 

0.3300 

0.3264 

0.3228 

0.3192 

0.3156 

0.3121 

-0.3 

0.3821 

0.3783 

0.3745 

0.3707 

0.3669 

0.3632 

0.3594 

0.3557 

0.3520 

0.3482 

-0.2 

0.4207 

0.4168 

0.4129 

0.4090 

0.4052 

0.4013 

0.3974 

0.3936 

0.3897 

0.3859 

-0.1 

0.4602 

0.4562 

0.4522 

0.4483 

0.4443 

0.4404 

0.4364 

0.4325 

0.4286 

0.4247 

- 0.0 

0.5000 

0.4960 

0.4920 

0.4880 

0.4840 

0.4801 

0.4761 

0.4721 

0.4681 

0.4641 


(< continúa) 
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Tabla A.3 Áreas de la Curva normal estándar (continuación) 


Apéndice/Tablas 669 
4>(z) = P{Z < z) 


z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

0.0 

0.5000 

0.5040 

0.5080 

0.5120 

0.5160 

0.5199 

0.5239 

0.5279 

0.5319 

0.5359 

0.1 

0.5398 

0.5438 

0.5478 

0.5517 

0.5557 

0.5596 

0.5636 

0.5675 

0.5714 

0.5753 

0.2 

0.5793 

0.5832 

0.5871 

0.5910 

0.5948 

0.5987 

0.6026 

0.6064 

0.6103 

0.6141 

0.3 

0.6179 

0.6217 

0.6255 

0.6293 

0.6331 

0.6368 

0.6406 

0.6443 

0.6480 

0.6517 

0.4 

0.6554 

0.6591 

0.6628 

0.6664 

0.6700 

0.6736 

0.6772 

0.6808 

0.6844 

0.6879 

0.5 

0.6915 

0.6950 

0.6985 

0.7019 

0.7054 

0.7088 

0.7123 

0.7157 

0.7190 

0.7224 

0.6 

0.7257 

0.7291 

0.7324 

0.7357 

0.7389 

0.7422 

0.7454 

0.7486 

0.7517 

0.7549 

0.7 

0.7580 

0.7611 

0.7642 

0.7673 

0.7704 

0.7734 

0.7764 

0.7794 

0.7823 

0.7852 

0.8 

0.7881 

0.7910 

0.7939 

0.7967 

0.7995 

0.8023 

0.8051 

0.8078 

0.8106 

0.8133 

0.9 

0.8159 

0.8186 

0.8212 

0.8238 

0.8264 

0.8289 

0.8315 

0.8340 

0.8365 

0.8389 

1.0 

0.8413 

0.8438 

0.8461 

0.8485 

0.8508 

0.8531 

0.8554 

0.8577 

0.8599 

0.8621 

1.1 

0.8643 

0.8665 

0.8686 

0.8708 

0.8729 

0.8749 

0.8770 

0.8790 

0.8810 

0.8830 

1.2 

0.8849 

0.8869 

0.8888 

0.8907 

0.8925 

0.8944 

0.8962 

0.8980 

0.8997 

0.9015 

1.3 

0.9032 

0.9049 

0.9066 

0.9082 

0.9099 

0.9115 

0.9131 

0.9147 

0.9162 

0.9177 

1.4 

0.9192 

0.9207 

0.9222 

0.9236 

0.9251 

0.9265 

0.9278 

0.9292 

0.9306 

0.9319 

1.5 

0.9332 

0.9345 

0.9357 

0.9370 

0.9382 

0.9394 

0.9406 

0.9418 

0.9429 

0.9441 

1.6 

0.9452 

0.9463 

0.9474 

0.9484 

0.9495 

0.9505 

0.9515 

0.9525 

0.9535 

0.9545 

1.7 

0.9554 

0.9564 

0.9573 

0.9582 

0.9591 

0.9599 

0.9608 

0.9616 

0.9625 

0.9633 

1.8 

0.9641 

0.9649 

0.9656 

0.9664 

0.9671 

0.9678 

0.9686 

0.9693 

0.9699 

0.9706 

1.9 

0.9713 

0.9719 

0.9726 

0.9732 

0.9738 

0.9744 

0.9750 

0.9756 

0.9761 

0.9767 

2.0 

0.9772 

0.9778 

0.9783 

0.9788 

0.9793 

0.9798 

0.9803 

0.9808 

0.9812 

0.9817 

2.1 

0.9821 

0.9826 

0.9830 

0.9834 

0.9838 

0.9842 

0.9846 

0.9850 

0.9854 

0.9857 

2.2 

0.9861 

0.9864 

0.9868 

0.9871 

0.9875 

0.9878 

0.9881 

0.9884 

0.9887 

0.9890 

2.3 

0.9893 

0.9896 

0.9898 

0.9901 

0.9904 

0.9906 

0.9909 

0.9911 

0.9913 

0.9916 

2.4 

0.9918 

0.9920 

0.9922 

0.9925 

0.9927 

0.9929 

0.9931 

0.9932 

0.9934 

0.9936 

2.5 

0.9938 

0.9940 

0.9941 

0.9943 

0.9945 

0.9946 

0.9948 

0.9949 

0.9951 

0.9952 

2.6 

0.9953 

0.9955 

0.9956 

0.9957 

0.9959 

0.9960 

0.9961 

0.9962 

0.9963 

0.9964 

2.7 

0.9965 

0.9966 

0.9967 

0.9968 

0.9969 

0.9970 

0.9971 

0.9972 

0.9973 

0.9974 

2.8 

0.9974 

0.9975 

0.9976 

0.9977 

0.9977 

0.9978 

0.9979 

0.9979 

0.9980 

0.9981 

2.9 

0.9981 

0.9982 

0.9982 

0.9983 

0.9984 

0.9984 

0.9985 

0.9985 

0.9986 

0.9986 

3.0 

0.9987 

0.9987 

0.9987 

0.9988 

0.9988 

0.9989 

0.9989 

0.9989 

0.9990 

0.9990 

3.1 

0.9990 

0.9991 

0.9991 

0.9991 

0.9992 

0.9992 

0.9992 

0.9992 

0.9993 

0.9993 

3.2 

0.9993 

0.9993 

0.9994 

0.9994 

0.9994 

0.9994 

0.9994 

0.9995 

0.9995 

0.9995 

3.3 

0.9995 

0.9995 

0.9995 

0.9996 

0.9996 

0.9996 

0.9996 

0.9996 

0.9996 

0.9997 

3.4 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9998 
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Tabla A.4 La Función Gama incompleta í x i _ y , 

^ J 0 r(a/ e - v 



1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

1 

0.632 

0.264 

0.080 

0.019 

0.004 

0.001 

0.000 

0.000 

0.000 

0.000 

2 

0.865 

0.594 

0.323 

0.143 

0.053 

0.017 

0.005 

0.001 

0.000 

0.000 

3 

0.950 

0.801 

0.577 

0.353 

0.185 

0.084 

0.034 

0.012 

0.004 

0.001 

4 

0.982 

0.908 

0.762 

0.567 

0.371 

0.215 

0.111 

0.051 

0.021 

0.008 

5 

0.993 

0.960 

0.875 

0.735 

0.560 

0.384 

0.238 

0.133 

0.068 

0.032 

6 

0.998 

0.983 

0.938 

0.849 

0.715 

0.554 

0.394 

0.256 

0.153 

0.084 

7 

0.999 

0.993 

0.970 

0.918 

0.827 

0.699 

0.550 

0.401 

0.271 

0.170 

8 

1.000 

0.997 

0.986 

0.958 

0.900 

0.809 

0.687 

0.547 

0.407 

0.283 

9 


0.999 

0.994 

0.979 

0.945 

0.884 

0.793 

0.676 

0.544 

0.413 

10 


1.000 

0.997 

0.990 

0.971 

0.933 

0.870 

0.780 

0.667 

0.542 

11 



0.999 

0.995 

0.985 

0.962 

0.921 

0.857 

0.768 

0.659 

12 



1.000 

0.998 

0.992 

0.980 

0.954 

0.911 

0.845 

0.758 

13 




0.999 

0.996 

0.989 

0.974 

0.946 

0.900 

0.834 

14 




1.000 

0.998 

0.994 

0.986 

0.968 

0.938 

0.891 

15 





0.999 

0.997 

0.992 

0.982 

0.963 

0.930 
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Tabla A.5 

Valores críticos 

para 

Distribuciones t 



t v curva de densidad 

/ 1 \ 

' i \ Área sombreada = a 

i x / 

1 N*/ 

i_i ^ 







0 t a ,v 






a 




'\ 

0.10 

0.05 

0.025 

0.01 

0.005 

0.001 

0.0005 

1 

3.078 

6.314 

12.706 

31.821 

63.657 

318.31 

636.62 

2 

1.886 

2.920 

4.303 

6.965 

9.925 

22.326 

31.598 

3 

1.638 

2.353 

3.182 

4.541 

5.841 

10.213 

12.924 

4 

1.533 

2.132 

2.776 

3.747 

4.604 

7.173 

8.610 

5 

1.476 

2.015 

2.571 

3.365 

4.032 

5.893 

6.869 

6 

1.440 

1.943 

2.447 

3.143 

3.707 

5.208 

5.959 

7 

1.415 

1.895 

2.365 

2.998 

3.499 

4.785 

5.408 

8 

1.397 

1.860 

2.306 

2.896 

3.355 

4.501 

5.041 

9 

1.383 

1.833 

2.262 

2.821 

3.250 

4.297 

4.781 

10 

1.372 

1.812 

2.228 

2.764 

3.169 

4.144 

4.587 

11 

1.363 

1.796 

2.201 

2.718 

3.106 

4.025 

4.437 

12 

1.356 

1.782 

2.179 

2.681 

3.055 

3.930 

4.318 

13 

1.350 

1.771 

2.160 

2.650 

3.012 

3.852 

4.221 

14 

1.345 

1.761 

2.145 

2.624 

2.977 

3.787 

4.140 

15 

1.341 

1.753 

2.131 

2.602 

2.947 

3.733 

4.073 

16 

1.337 

1.746 

2.120 

2.583 

2.921 

3.686 

4.015 

17 

1.333 

1.740 

2.110 

2.567 

2.898 

3.646 

3.965 

18 

1.330 

1.734 

2.101 

2.552 

2.878 

3.610 

3.922 

19 

1.328 

1.729 

2.093 

2.539 

2.861 

3.579 

3.883 

20 

1.325 

1.725 

2.086 

2.528 

2.845 

3.552 

3.850 

21 

1.323 

1.721 

2.080 

2.518 

2.831 

3.527 

3.819 

22 

1.321 

1.717 

2.074 

2.508 

2.819 

3.505 

3.792 

23 

1.319 

1.714 

2.069 

2.500 

2.807 

3.485 

3.767 

24 

1.318 

1.711 

2.064 

2.492 

2.797 

3.467 

3.745 

25 

1.316 

1.708 

2.060 

2.485 

2.787 

3.450 

3.725 

26 

1.315 

1.706 

2.056 

2.479 

2.779 

3.435 

3.707 

27 

1.314 

1.703 

2.052 

2.473 

2.771 

3.421 

3.690 

28 

1.313 

1.701 

2.048 

2.467 

2.763 

3.408 

3.674 

29 

1.311 

1.699 

2.045 

2.462 

2.756 

3.396 

3.659 

30 

1.310 

1.697 

2.042 

2.457 

2.750 

3.385 

3.646 

32 

1.309 

1.694 

2.037 

2.449 

2.738 

3.365 

3.622 

34 

1.307 

1.691 

2.032 

2.441 

2.728 

3.348 

3.601 

36 

1.306 

1.688 

2.028 

2.434 

2.719 

3.333 

3.582 

38 

1.304 

1.686 

2.024 

2.429 

2.712 

3.319 

3.566 

40 

1.303 

1.684 

2.021 

2.423 

2.704 

3.307 

3.551 

50 

1.299 

1.676 

2.009 

2.403 

2.678 

3.262 

3.496 

60 

1.296 

1.671 

2.000 

2.390 

2.660 

3.232 

3.460 

120 

1.289 

1.658 

1.980 

2.358 

2.617 

3.160 

3.373 

00 

1.282 

1.645 

1.960 

2.326 

2.576 

3.090 

3.291 
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Tabla A.7 Valores críticos para distribuciones c/o-cuadrada 



a 


"\ 

0.995 

0.99 

0.975 

0.95 

0.90 

0.10 

0.05 

0.025 

0.01 

0.005 

1 

0.000 

0.000 

0.001 

0.004 

0.016 

2.706 

3.843 

5.025 

6.637 

7.882 

2 

0.010 

0.020 

0.051 

0.103 

0.211 

4.605 

5.992 

7.378 

9.210 

10.597 

3 

0.072 

0.115 

0.216 

0.352 

0.584 

6.251 

7.815 

9.348 

11.344 

12.837 

4 

0.207 

0.297 

0.484 

0.711 

1.064 

7.779 

9.488 

11.143 

13.277 

14.860 

5 

0.412 

0.554 

0.831 

1.145 

1.610 

9.236 

11.070 

12.832 

15.085 

16.748 

6 

0.676 

0.872 

1.237 

1.635 

2.204 

10.645 

12.592 

14.440 

16.812 

18.548 

7 

0.989 

1.239 

1.690 

2.167 

2.833 

12.017 

14.067 

16.012 

18.474 

20.276 

8 

1.344 

1.646 

2.180 

2.733 

3.490 

13.362 

15.507 

17.534 

20.090 

21.954 

9 

1.735 

2.088 

2.700 

3.325 

4.168 

14.684 

16.919 

19.022 

21.665 

23.587 

10 

2.156 

2.558 

3.247 

3.940 

4.865 

15.987 

18.307 

20.483 

23.209 

25.188 

11 

2.603 

3.053 

3.816 

4.575 

5.578 

17.275 

19.675 

21.920 

24.724 

26.755 

12 

3.074 

3.571 

4.404 

5.226 

6.304 

18.549 

21.026 

23.337 

26.217 

28.300 

13 

3.565 

4.107 

5.009 

5.892 

7.041 

19.812 

22.362 

24.735 

27.687 

29.817 

14 

4.075 

4.660 

5.629 

6.571 

7.790 

21.064 

23.685 

26.119 

29.141 

31.319 

15 

4.600 

5.229 

6.262 

7.261 

8.547 

22.307 

24.996 

27.488 

30.577 

32.799 

16 

5.142 

5.812 

6.908 

7.962 

9.312 

23.542 

26.296 

28.845 

32.000 

34.267 

17 

5.697 

6.407 

7.564 

8.682 

10.085 

24.769 

27.587 

30.190 

33.408 

35.716 

18 

6.265 

7.015 

8.231 

9.390 

10.865 

25.989 

28.869 

31.526 

34.805 

37.156 

19 

6.843 

7.632 

8.906 

10.117 

11.651 

27.203 

30.143 

32.852 

36.190 

38.580 

20 

7.434 

8.260 

9.591 

10.851 

12.443 

28.412 

31.410 

34.170 

37.566 

39.997 

21 

8.033 

8.897 

10.283 

11.591 

13.240 

29.615 

32.670 

35.478 

38.930 

41.399 

22 

8.643 

9.542 

10.982 

12.338 

14.042 

30.813 

33.924 

36.781 

40.289 

42.796 

23 

9.260 

10.195 

11.688 

13.090 

14.848 

32.007 

35.172 

38.075 

41.637 

44.179 

24 

9.886 

10.856 

12.401 

13.848 

15.659 

33.196 

36.415 

39.364 

42.980 

45.558 

25 

10.519 

11.523 

13.120 

14.611 

16.473 

34.381 

37.652 

40.646 

44.313 

46.925 

26 

11.160 

12.198 

13.844 

15.379 

17.292 

35.563 

38.885 

41.923 

45.642 

48.290 

27 

11.807 

12.878 

14.573 

16.151 

18.114 

36.741 

40.113 

43.194 

46.962 

49.642 

28 

12.461 

13.565 

15.308 

16.928 

18.939 

37.916 

41.337 

44.461 

48.278 

50.993 

29 

13.120 

14.256 

16.147 

17.708 

19.768 

39.087 

42.557 

45.772 

49.586 

52.333 

30 

13.787 

14.954 

16.791 

18.493 

20.599 

40.256 

43.773 

46.979 

50.892 

53.672 

31 

14.457 

15.655 

17.538 

19.280 

21.433 

41.422 

44.985 

48.231 

52.190 

55.000 

32 

15.134 

16.362 

18.291 

20.072 

22.271 

42.585 

46.194 

49.480 

53.486 

56.328 

33 

15.814 

17.073 

19.046 

20.866 

23.110 

43.745 

47.400 

50.724 

54.774 

57.646 

34 

16.501 

17.789 

19.806 

21.664 

23.952 

44.903 

48.602 

51.966 

56.061 

58.964 

35 

17.191 

18.508 

20.569 

22.465 

24.796 

46.059 

49.802 

53.203 

57.340 

60.272 

36 

17.887 

19.233 

21.336 

23.269 

25.643 

47.212 

50.998 

54.437 

58.619 

61.581 

37 

18.584 

19.960 

22.105 

24.075 

26.492 

48.363 

52.192 

55.667 

59.891 

62.880 

38 

19.289 

20.691 

22.878 

24.884 

27.343 

49.513 

53.384 

56.896 

61.162 

64.181 

39 

19.994 

21.425 

23.654 

25.695 

28.196 

50.660 

54.572 

58.119 

62.426 

65.473 

40 

20.706 

22.164 

24.433 

26.509 

29.050 

51.805 

55.758 

59.342 

63.691 

66.766 


Para v > 40, v 2 ~ vil - 1-7 ,—) 

^ 9v \9vj 
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Tabla A.8 Curva t para áreas de cola 


Área a la 
derecha de t 



í\l> 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

0.0 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.1 

0.468 

0.465 

0.463 

0.463 

0.462 

0.462 

0.462 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.2 

0.437 

0.430 

0.427 

0.426 

0.425 

0.424 

0.424 

0.423 

0.423 

0.423 

0.423 

0.422 

0.422 

0.422 

0.422 

0.422 

0.422 

0.422 

0.3 

0.407 

0.396 

0.392 

0.390 

0.388 

0.387 

0.386 

0.386 

0.386 

0.385 

0.385 

0.385 

0.384 

0.384 

0.384 

0.384 

0.384 

0.384 

0.4 

0.379 

0.364 

0.358 

0.355 

0.353 

0.352 

0.351 

0.350 

0.349 

0.349 

0.348 

0.348 

0.348 

0.347 

0.347 

0.347 

0.347 

0.347 

0.5 

0.352 

0.333 

0.326 

0.322 

0.319 

0.317 

0.316 

0.315 

0.315 

0.314 

0.313 

0.313 

0.313 

0.312 

0.312 

0.312 

0.312 

0.312 

0.6 

0.328 

0.305 

0.295 

0.290 

0.287 

0.285 

0.284 

0.283 

0.282 

0.281 

0.280 

0.280 

0.279 

0.279 

0.279 

0.278 

0.278 

0.278 

0.7 

0.306 

0.278 

0.267 

0.261 

0.258 

0.255 

0.253 

0.252 

0.251 

0.250 

0.249 

0.249 

0.248 

0.247 

0.247 

0.247 

0.247 

0.246 

0.8 

0.285 

0.254 

0.241 

0.234 

0.230 

0.227 

0.225 

0.223 

0.222 

0.221 

0.220 

0.220 

0.219 

0.218 

0.218 

0.218 

0.217 

0.217 

0.9 

0.267 

0.232 

0.217 

0.210 

0.205 

0.201 

0.199 

0.197 

0.196 

0.195 

0.194 

0.193 

0.192 

0.191 

0.191 

0.191 

0.190 

0.190 

1.0 

0.250 

0.211 

0.196 

0.187 

0.182 

0.178 

0.175 

0.173 

0.172 

0.170 

0.169 

0.169 

0.168 

0.167 

0.167 

0.166 

0.166 

0.165 

1.1 

0.235 

0.193 

0.176 

0.167 

0.162 

0.157 

0.154 

0.152 

0.150 

0.149 

0.147 

0.146 

0.146 

0.144 

0.144 

0.144 

0.143 

0.143 

1.2 

0.221 

0.177 

0.158 

0.148 

0.142 

0.138 

0.135 

0.132 

0.130 

0.129 

0.128 

0.127 

0.126 

0.124 

0.124 

0.124 

0.123 

0.123 

1.3 

0.209 

0.162 

0.142 

0.132 

0.125 

0.121 

0.117 

0.115 

0.113 

0.111 

0.110 

0.109 

0.108 

0.107 

0.107 

0.106 

0.105 

0.105 

1.4 

0.197 

0.148 

0.128 

0.117 

0.110 

0.106 

0.102 

0.100 

0.098 

0.096 

0.095 

0.093 

0.092 

0.091 

0.091 

0.090 

0.090 

0.089 

1.5 

0.187 

0.136 

0.115 

0.104 

0.097 

0.092 

0.089 

0.086 

0.084 

0.082 

0.081 

0.080 

0.079 

0.077 

0.077 

0.077 

0.076 

0.075 

1.6 

0.178 

0.125 

0.104 

0.092 

0.085 

0.080 

0.077 

0.074 

0.072 

0.070 

0.069 

0.068 

0.067 

0.065 

0.065 

0.065 

0.064 

0.064 

1.7 

0.169 

0.116 

0.094 

0.082 

0.075 

0.070 

0.065 

0.064 

0.062 

0.060 

0.059 

0.057 

0.056 

0.055 

0.055 

0.054 

0.054 

0.053 

1.8 

0.161 

0.107 

0.085 

0.073 

0.066 

0.061 

0.057 

0.055 

0.053 

0.051 

0.050 

0.049 

0.048 

0.046 

0.046 

0.045 

0.045 

0.044 

1.9 

0.154 

0.099 

0.077 

0.065 

0.058 

0.053 

0.050 

0.047 

0.045 

0.043 

0.042 

0.041 

0.040 

0.038 

0.038 

0.038 

0.037 

0.037 

2.0 

0.148 

0.092 

0.070 

0.058 

0.051 

0.046 

0.043 

0.040 

0.038 

0.037 

0.035 

0.034 

0.033 

0.032 

0.032 

0.031 

0.031 

0.030 

2.1 

0.141 

0.085 

0.063 

0.052 

0.045 

0.040 

0.037 

0.034 

0.033 

0.031 

0.030 

0.029 

0.028 

0.027 

0.027 

0.026 

0.025 

0.025 

2.2 

0.136 

0.079 

0.058 

0.046 

0.040 

0.035 

0.032 

0.029 

0.028 

0.026 

0.025 

0.024 

0.023 

0.022 

0.022 

0.021 

0.021 

0.021 

2.3 

0.131 

0.074 

0.052 

0.041 

0.035 

0.031 

0.027 

0.025 

0.023 

0.022 

0.021 

0.020 

0.019 

0.018 

0.018 

0.018 

0.017 

0.017 

2.4 

0.126 

0.069 

0.048 

0.037 

0.031 

0.027 

0.024 

0.022 

0.020 

0.019 

0.018 

0.017 

0.016 

0.015 

0.015 

0.014 

0.014 

0.014 

2.5 

0.121 

0.065 

0.044 

0.033 

0.027 

0.023 

0.020 

0.018 

0.017 

0.016 

0.015 

0.014 

0.013 

0.012 

0.012 

0.012 

0.011 

0.011 

2.6 

0.117 

0.061 

0.040 

0.030 

0.024 

0.020 

0.018 

0.016 

0.014 

0.013 

0.012 

0.012 

0.011 

0.010 

0.010 

0.010 

0.009 

0.009 

2.7 

0.113 

0.057 

0.037 

0.027 

0.021 

0.018 

0.015 

0.014 

0.012 

0.011 

0.010 

0.010 

0.009 

0.008 

0.008 

0.008 

0.008 

0.007 

2.8 

0.109 

0.054 

0.034 

0.024 

0.019 

0.016 

0.013 

0.012 

0.010 

0.009 

0.009 

0.008 

0.008 

0.007 

0.007 

0.006 

0.006 

0.006 

2.9 

0.106 

0.051 

0.031 

0.022 

0.017 

0.014 

0.011 

0.010 

0.009 

0.008 

0.007 

0.007 

0.006 

0.005 

0.005 

0.005 

0.005 

0.005 

3.0 

0.102 

0.048 

0.029 

0.020 

0.015 

0.012 

0.010 

0.009 

0.007 

0.007 

0.006 

0.006 

0.005 

0.004 

0.004 

0.004 

0.004 

0.004 

3.1 

0.099 

0.045 

0.027 

0.018 

0.013 

0.011 

0.009 

0.007 

0.006 

0.006 

0.005 

0.005 

0.004 

0.004 

0.004 

0.003 

0.003 

0.003 

3.2 

0.096 

0.043 

0.025 

0.016 

0.012 

0.009 

0.008 

0.006 

0.005 

0.005 

0.004 

0.004 

0.003 

0.003 

0.003 

0.003 

0.003 

0.002 

3.3 

0.094 

0.040 

0.023 

0.015 

0.011 

0.008 

0.007 

0.005 

0.005 

0.004 

0.004 

0.003 

0.003 

0.002 

0.002 

0.002 

0.002 

0.002 

3.4 

0.091 

0.038 

0.021 

0.014 

0.010 

0.007 

0.006 

0.005 

0.004 

0.003 

0.003 

0.003 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

3.5 

0.089 

0.036 

0.020 

0.012 

0.009 

0.006 

0.005 

0.004 

0.003 

0.003 

0.002 

0.002 

0.002 

0.002 

0.002 

0.001 

0.001 

0.001 

3.6 

0.086 

0.035 

0.018 

0.011 

0.008 

0.006 

0.004 

0.004 

0.003 

0.002 

0.002 

0.002 

0.002 

0.001 

0.001 

0.001 

0.001 

0.001 

3.7 

0.084 

0.033 

0.017 

0.010 

0.007 

0.005 

0.004 

0.003 

0.002 

0.002 

0.002 

0.002 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

3.8 

0.082 

0.031 

0.016 

0.010 

0.006 

0.004 

0.003 

0.003 

0.002 

0.002 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

3.9 

0.080 

0.030 

0.015 

0.009 

0.006 

0.004 

0.003 

0.002 

0.002 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

4.0 

0.078 

0.029 

0.014 

0.008 

0.005 

0.004 

0.003 

0.002 

0.002 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.000 

0.000 


( continúa ) 
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Tabla A.8 Curva í para áreas de cola (continuación) 








curva t 

_L 

0 

_ 

Área a la 
derecha de t 

T*-- 







t\v 

19 

20 

21 

22 

23 

24 

25 

26 

27 

28 

29 

30 

35 

40 

60 

120 

°°(=z) 

0.0 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.500 

0.1 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.461 

0.460 

0.460 

0.460 

0.460 

0.460 

0.2 

0.422 

0.422 

0.422 

0.422 

0.422 

0.422 

0.422 

0.422 

0.421 

0.421 

0.421 

0.421 

0.421 

0.421 

0.421 

0.421 

0.421 

0.3 

0.384 

0.384 

0.384 

0.383 

0.383 

0.383 

0.383 

0.383 

0.383 

0.383 

0.383 

0.383 

0.383 

0.383 

0.383 

0.382 

0.382 

0.4 

0.347 

0.347 

0.347 

0.347 

0.346 

0.346 

0.346 

0.346 

0.346 

0.346 

0.346 

0.346 

0.346 

0.346 

0.345 

0.345 

0.345 

0.5 

0.311 

0.311 

0.311 

0.311 

0.311 

0.311 

0.311 

0.311 

0.311 

0.310 

0.310 

0.310 

0.310 

0.310 

0.309 

0.309 

0.309 

0.6 

0.278 

0.278 

0.278 

0.277 

0.277 

0.277 

0.277 

0.277 

0.277 

0.277 

0.277 

0.277 

0.276 

0.276 

0.275 

0.275 

0.274 

0.7 

0.246 

0.246 

0.246 

0.246 

0.245 

0.245 

0.245 

0.245 

0.245 

0.245 

0.245 

0.245 

0.244 

0.244 

0.243 

0.243 

0.242 

0.8 

0.217 

0.217 

0.216 

0.216 

0.216 

0.216 

0.216 

0.215 

0.215 

0.215 

0.215 

0.215 

0.215 

0.214 

0.213 

0.213 

0.212 

0.9 

0.190 

0.189 

0.189 

0.189 

0.189 

0.189 

0.188 

0.188 

0.188 

0.188 

0.188 

0.188 

0.187 

0.187 

0.186 

0.185 

0.184 

1.0 

0.165 

0.165 

0.164 

0.164 

0.164 

0.164 

0.163 

0.163 

0.163 

0.163 

0.163 

0.163 

0.162 

0.162 

0.161 

0.160 

0.159 

1.1 

0.143 

0.142 

0.142 

0.142 

0.141 

0.141 

0.141 

0.141 

0.141 

0.140 

0.140 

0.140 

0.139 

0.139 

0.138 

0.137 

0.136 

1.2 

0.122 

0.122 

0.122 

0.121 

0.121 

0.121 

0.121 

0.120 

0.120 

0.120 

0.120 

0.120 

0.119 

0.119 

0.117 

0.116 

0.115 

1.3 

0.105 

0.104 

0.104 

0.104 

0.103 

0.103 

0.103 

0.103 

0.102 

0.102 

0.102 

0.102 

0.101 

0.101 

0.099 

0.098 

0.097 

1.4 

0.089 

0.089 

0.088 

0.088 

0.087 

0.087 

0.087 

0.087 

0.086 

0.086 

0.086 

0.086 

0.085 

0.085 

0.083 

0.082 

0.081 

1.5 

0.075 

0.075 

0.074 

0.074 

0.074 

0.073 

0.073 

0.073 

0.073 

0.072 

0.072 

0.072 

0.071 

0.071 

0.069 

0.068 

0.067 

1.6 

0.063 

0.063 

0.062 

0.062 

0.062 

0.061 

0.061 

0.061 

0.061 

0.060 

0.060 

0.060 

0.059 

0.059 

0.057 

0.056 

0.055 

1.7 

0.053 

0.052 

0.052 

0.052 

0.051 

0.051 

0.051 

0.051 

0.050 

0.050 

0.050 

0.050 

0.049 

0.048 

0.047 

0.046 

0.045 

1.8 

0.044 

0.043 

0.043 

0.043 

0.042 

0.042 

0.042 

0.042 

0.042 

0.041 

0.041 

0.041 

0.040 

0.040 

0.038 

0.037 

0.036 

1.9 

0.036 

0.036 

0.036 

0.035 

0.035 

0.035 

0.035 

0.034 

0.034 

0.034 

0.034 

0.034 

0.033 

0.032 

0.031 

0.030 

0.029 

2.0 

0.030 

0.030 

0.029 

0.029 

0.029 

0.028 

0.028 

0.028 

0.028 

0.028 

0.027 

0.027 

0.027 

0.026 

0.025 

0.024 

0.023 

2.1 

0.025 

0.024 

0.024 

0.024 

0.023 

0.023 

0.023 

0.023 

0.023 

0.022 

0.022 

0.022 

0.022 

0.021 

0.020 

0.019 

0.018 

2.2 

0.020 

0.020 

0.020 

0.019 

0.019 

0.019 

0.019 

0.018 

0.018 

0.018 

0.018 

0.018 

0.017 

0.017 

0.016 

0.015 

0.014 

2.3 

0.016 

0.016 

0.016 

0.016 

0.015 

0.015 

0.015 

0.015 

0.015 

0.015 

0.014 

0.014 

0.014 

0.013 

0.012 

0.012 

0.011 

2.4 

0.013 

0.013 

0.013 

0.013 

0.012 

0.012 

0.012 

0.012 

0.012 

0.012 

0.012 

0.011 

0.011 

0.011 

0.010 

0.009 

0.008 

2.5 

0.011 

0.011 

0.010 

0.010 

0.010 

0.010 

0.010 

0.010 

0.009 

0.009 

0.009 

0.009 

0.009 

0.008 

0.008 

0.007 

0.006 

2.6 

0.009 

0.009 

0.008 

0.008 

0.008 

0.008 

0.008 

0.008 

0.007 

0.007 

0.007 

0.007 

0.007 

0.007 

0.006 

0.005 

0.005 

2.7 

0.007 

0.007 

0.007 

0.007 

0.006 

0.006 

0.006 

0.006 

0.006 

0.006 

0.006 

0.006 

0.005 

0.005 

0.004 

0.004 

0.003 

2.8 

0.006 

0.006 

0.005 

0.005 

0.005 

0.005 

0.005 

0.005 

0.005 

0.005 

0.005 

0.004 

0.004 

0.004 

0.003 

0.003 

0.003 

2.9 

0.005 

0.004 

0.004 

0.004 

0.004 

0.004 

0.004 

0.004 

0.004 

0.004 

0.004 

0.003 

0.003 

0.003 

0.003 

0.002 

0.002 

3.0 

0.004 

0.004 

0.003 

0.003 

0.003 

0.003 

0.003 

0.003 

0.003 

0.003 

0.003 

0.003 

0.002 

0.002 

0.002 

0.002 

0.001 

3.1 

0.003 

0.003 

0.003 

0.003 

0.003 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.001 

0.001 

0.001 

3.2 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.002 

0.001 

0.001 

0.001 

0.001 

0.001 

3.3 

0.002 

0.002 

0.002 

0.002 

0.002 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.000 

3.4 

0.002 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.000 

0.000 

3.5 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.000 

0.000 

0.000 

3.6 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

3.7 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

3.8 

0.001 

0.001 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

3.9 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

4.0 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 
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Tabla A.9 Valores críticos para distribuciones F 





v i 

= gl numerador 





a 

1 

2 

3 

4 

5 

6 

7 

8 

9 



0.100 

39.86 

49.50 

53.59 

55.83 

57.24 

58.20 

58.91 

59.44 

59.86 



0.050 

161.45 

199.50 

215.71 

224.58 

230.16 

233.99 

236.77 

238.88 

240.54 



0.010 

4052.2 

4999.5 

5403.4 

5624.6 

5763.6 

5859.0 

5928.4 

5981.1 

6022.5 



0.001 

405284 

500000 

540379 

562500 

576405 

585937 

592873 

598144 

602284 



0.100 

8.53 

9.00 

9.16 

9.24 

9.29 

9.33 

9.35 

9.37 

9.38 



0.050 

18.51 

19.00 

19.16 

19.25 

19.30 

19.33 

19.35 

19.37 

19.38 


¿á 

0.010 

98.50 

99.00 

99.17 

99.25 

99.30 

99.33 

99.36 

99.37 

99.39 



0.001 

998.50 

999.00 

999.17 

999.25 

999.30 

999.33 

999.36 

999.37 

999.39 



0.100 

5.54 

5.46 

5.39 

5.34 

5.31 

5.28 

5.27 

5.25 

5.24 



0.050 

10.13 

9.55 

9.28 

9.12 

9.01 

8.94 

8.89 

8.85 

8.81 



0.010 

34.12 

30.82 

29.46 

28.71 

28.24 

27.91 

27.67 

27.49 

27.35 



0.001 

167.03 

148.50 

141.11 

137.10 

134.58 

132.85 

131.58 

130.62 

129.86 



0.100 

4.54 

4.32 

4.19 

4.11 

4.05 

4.01 

3.98 

3.95 

3.94 



0.050 

7.71 

6.94 

6.59 

6.39 

6.26 

6.16 

6.09 

6.04 

6.00 



0.010 

21.20 

18.00 

16.69 

15.98 

15.52 

15.21 

14.98 

14.80 

14.66 



0.001 

74.14 

61.25 

56.18 

53.44 

51.71 

50.53 

49.66 

49.00 

48.47 



0.100 

4.06 

3.78 

3.62 

3.52 

3.45 

3.40 

3.37 

3.34 

3.32 



0.050 

6.61 

5.79 

5.41 

5.19 

5.05 

4.95 

4.88 

4.82 

4.77 



0.010 

16.26 

13.27 

12.06 

11.39 

10.97 

10.67 

10.46 

10.29 

10.16 



0.001 

47.18 

37.12 

33.20 

31.09 

29.75 

28.83 

28.16 

27.65 

27.24 

u 

o 


0.100 

3.78 

3.46 

3.29 

3.18 

3.11 

3.05 

3.01 

2.98 

2.96 

-d 

CS 


0.050 

5.99 

5.14 

4.76 

4.53 

4.39 

4.28 

4.21 

4.15 

4.10 

’g 


0.010 

13.75 

10.92 

9.78 

9.15 

8.75 

8.47 

8.26 

8.10 

7.98 

o 

c 


0.001 

35.51 

27.00 

23.70 

21.92 

20.80 

20.03 

19.46 

19.03 

18.69 

■d 


0.100 

3.59 

3.26 

3.07 

2.96 

2.88 

2.83 

2.78 

2.75 

2.72 

WD 


0.050 

5.59 

4.74 

4.35 

4.12 

3.97 

3.87 

3.79 

3.73 

3.68 



0.010 

12.25 

9.55 

8.45 

7.85 

7.46 

7.19 

6.99 

6.84 

6.72 



0.001 

29.25 

21.69 

18.77 

17.20 

16.21 

15.52 

15.02 

14.63 

14.33 



0.100 

3.46 

3.11 

2.92 

2.81 

2.73 

2.67 

2.62 

2.59 

2.56 



0.050 

5.32 

4.46 

4.07 

3.84 

3.69 

3.58 

3.50 

3.44 

3.39 



0.010 

11.26 

8.65 

7.59 

7.01 

6.63 

6.37 

6.18 

6.03 

5.91 



0.001 

25.41 

18.49 

15.83 

14.39 

13.48 

12.86 

12.40 

12.05 

11.77 



0.100 

3.36 

3.01 

2.81 

2.69 

2.61 

2.55 

2.51 

2.47 

2.44 



0.050 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

3.29 

3.23 

3.18 



0.010 

10.56 

8.02 

6.99 

6.42 

6.06 

5.80 

5.61 

5.47 

5.35 



0.001 

22.86 

16.39 

13.90 

12.56 

11.71 

11.13 

10.70 

10.37 

10.11 



0.100 

3.29 

2.92 

2.73 

2.61 

2.52 

2.46 

2.41 

2.38 

2.35 



0.050 

4.96 

4.10 

3.71 

3.48 

3.33 

3.22 

3.14 

3.07 

3.02 



0.010 

10.04 

7.56 

6.55 

5.99 

5.64 

5.39 

5.20 

5.06 

4.94 



0.001 

21.04 

14.91 

12.55 

11.28 

10.48 

9.93 

9.52 

9.20 

8.96 



0.100 

3.23 

2.86 

2.66 

2.54 

2.45 

2.39 

2.34 

2.30 

2.27 



0.050 

4.84 

3.98 

3.59 

3.36 

3.20 

3.09 

3.01 

2.95 

2.90 



0.010 

9.65 

7.21 

6.22 

5.67 

5.32 

5.07 

4.89 

4.74 

4.63 



0.001 

19.69 

13.81 

11.56 

10.35 

9.58 

9.05 

8.66 

8.35 

8.12 



0.100 

3.18 

2.81 

2.61 

2.48 

2.39 

2.33 

2.28 

2.24 

2.21 



0.050 

4.75 

3.89 

3.49 

3.26 

3.11 

3.00 

2.91 

2.85 

2.80 


AZ< 

0.010 

9.33 

6.93 

5.95 

5.41 

5.06 

4.82 

4.64 

4.50 

4.39 



0.001 

18.64 

12.97 

10.80 

9.63 

8.89 

8.38 

8.00 

7.71 

7.48 


(< continúa) 
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Tabla A.9 Valores críticos para distribuciones F (continuación) 


v 1 = gl numerador 


10 

12 

15 

20 

25 

30 

40 

50 

60 

120 

1000 

60.19 

60.71 

61.22 

61.74 

62.05 

62.26 

62.53 

62.69 

62.79 

63.06 

63.30 

241.88 

243.91 

245.95 

248.01 

249.26 

250.10 

251.14 

251.77 

252.20 

253.25 

254.19 

6055.8 

6106.3 

6157.3 

6208.7 

6239.8 

6260.6 

6286.8 

6302.5 

6313.0 

6339.4 

6362.7 

605621 

610668 

615764 

620908 

624017 

626099 

628712 

630285 

631337 

633972 

636301 

9.39 

9.41 

9.42 

9.44 

9.45 

9.46 

9.47 

9.47 

9.47 

9.48 

9.49 

19.40 

19.41 

19.43 

19.45 

19.46 

19.46 

19.47 

19.48 

19.48 

19.49 

19.49 

99.40 

99.42 

99.43 

99.45 

99.46 

99.47 

99.47 

99.48 

99.48 

99.49 

99.50 

999.40 

999.42 

999.43 

999.45 

999.46 

999.47 

999.47 

999.48 

999.48 

999.49 

999.50 

5.23 

5.22 

5.20 

5.18 

5.17 

5.17 

5.16 

5.15 

5.15 

5.14 

5.13 

8.79 

8.74 

8.70 

8.66 

8.63 

8.62 

8.59 

8.58 

8.57 

8.55 

8.53 

27.23 

27.05 

26.87 

26.69 

26.58 

26.50 

26.41 

26.35 

26.32 

26.22 

26.14 

129.25 

128.32 

127.37 

126.42 

125.84 

125.45 

124.96 

124.66 

124.47 

123.97 

123.53 

3.92 

3.90 

3.87 

3.84 

3.83 

3.82 

3.80 

3.80 

3.79 

3.78 

3.76 

5.96 

5.91 

5.86 

5.80 

5.77 

5.75 

5.72 

5.70 

5.69 

5.66 

5.63 

14.55 

14.37 

14.20 

14.02 

13.91 

13.84 

13.75 

13.69 

13.65 

13.56 

13.47 

48.05 

47.41 

46.76 

46.10 

45.70 

45.43 

45.09 

44.88 

44.75 

44.40 

44.09 

3.30 

3.27 

3.24 

3.21 

3.19 

3.17 

3.16 

3.15 

3.14 

3.12 

3.11 

4.74 

4.68 

4.62 

4.56 

4.52 

4.50 

4.46 

4.44 

4.43 

4.40 

4.37 

10.05 

9.89 

9.72 

9.55 

9.45 

9.38 

9.29 

9.24 

9.20 

9.11 

9.03 

26.92 

26.42 

25.91 

25.39 

25.08 

24.87 

24.60 

24.44 

24.33 

24.06 

23.82 

2.94 

2.90 

2.87 

2.84 

2.81 

2.80 

2.78 

2.77 

2.76 

2.74 

2.72 

4.06 

4.00 

3.94 

3.87 

3.83 

3.81 

3.77 

3.75 

3.74 

3.70 

3.67 

7.87 

7.72 

7.56 

7.40 

7.30 

7.23 

7.14 

7.09 

7.06 

6.97 

6.89 

18.41 

17.99 

17.56 

17.12 

16.85 

16.67 

16.44 

16.31 

16.21 

15.98 

15.77 

2.70 

2.67 

2.63 

2.59 

2.57 

2.56 

2.54 

2.52 

2.51 

2.49 

2.47 

3.64 

3.57 

3.51 

3.44 

3.40 

3.38 

3.34 

3.32 

3.30 

3.27 

3.23 

6.62 

6.47 

6.31 

6.16 

6.06 

5.99 

5.91 

5.86 

5.82 

5.74 

5.66 

14.08 

13.71 

13.32 

12.93 

12.69 

12.53 

12.33 

12.20 

12.12 

11.91 

11.72 

2.54 

2.50 

2.46 

2.42 

2.40 

2.38 

2.36 

2.35 

2.34 

2.32 

2.30 

3.35 

3.28 

3.22 

3.15 

3.11 

3.08 

3.04 

3.02 

3.01 

2.97 

2.93 

5.81 

5.67 

5.52 

5.36 

5.26 

5.20 

5.12 

5.07 

5.03 

4.95 

4.87 

11.54 

11.19 

10.84 

10.48 

10.26 

10.11 

9.92 

9.80 

9.73 

9.53 

9.36 

2.42 

2.38 

2.34 

2.30 

2.27 

2.25 

2.23 

2.22 

2.21 

2.18 

2.16 

3.14 

3.07 

3.01 

2.94 

2.89 

2.86 

2.83 

2.80 

2.79 

2.75 

2.71 

5.26 

5.11 

4.96 

4.81 

4.71 

4.65 

4.57 

4.52 

4.48 

4.40 

4.32 

9.89 

9.57 

9.24 

8.90 

8.69 

8.55 

8.37 

8.26 

8.19 

8.00 

7.84 

2.32 

2.28 

2.24 

2.20 

2.17 

2.16 

2.13 

2.12 

2.11 

2.08 

2.06 

2.98 

2.91 

2.85 

2.77 

2.73 

2.70 

2.66 

2.64 

2.62 

2.58 

2.54 

4.85 

4.71 

4.56 

4.41 

4.31 

4.25 

4.17 

4.12 

4.08 

4.00 

3.92 

8.75 

8.45 

8.13 

7.80 

7.60 

7.47 

7.30 

7.19 

7.12 

6.94 

6.78 

2.25 

2.21 

2.17 

2.12 

2.10 

2.08 

2.05 

2.04 

2.03 

2.00 

1.98 

2.85 

2.79 

2.72 

2.65 

2.60 

2.57 

2.53 

2.51 

2.49 

2.45 

2.41 

4.54 

4.40 

4.25 

4.10 

4.01 

3.94 

3.86 

3.81 

3.78 

3.69 

3.61 

7.92 

7.63 

7.32 

7.01 

6.81 

6.68 

6.52 

6.42 

6.35 

6.18 

6.02 

2.19 

2.15 

2.10 

2.06 

2.03 

2.01 

1.99 

1.97 

1.96 

1.93 

1.91 

2.75 

2.69 

2.62 

2.54 

2.50 

2.47 

2.43 

2.40 

2.38 

2.34 

2.30 

4.30 

4.16 

4.01 

3.86 

3.76 

3.70 

3.62 

3.57 

3.54 

3.45 

3.37 

7.29 

7.00 

6.71 

6.40 

6.22 

6.09 

5.93 

5.83 

5.76 

5.59 

5.44 

(i continúa ) 
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Tabla A.9 Valores críticos para distribuciones F (continuación) 



v 1 = gl numerador 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 



0.100 

3.14 

2.76 

2.56 

2.43 

2.35 

2.28 

2.23 

2.20 

2.16 



0.050 

4.67 

3.81 

3.41 

3.18 

3.03 

2.92 

2.83 

2.77 

2.71 


u 

0.010 

9.07 

6.70 

5.74 

5.21 

4.86 

4.62 

4.44 

4.30 

4.19 



0.001 

17.82 

12.31 

10.21 

9.07 

8.35 

7.86 

7.49 

7.21 

6.98 



0.100 

3.10 

2.73 

2.52 

2.39 

2.31 

2.24 

2.19 

2.15 

2.12 



0.050 

4.60 

3.74 

3.34 

3.11 

2.96 

2.85 

2.76 

2.70 

2.65 



0.010 

8.86 

6.51 

5.56 

5.04 

4.69 

4.46 

4.28 

4.14 

4.03 



0.001 

17.14 

11.78 

9.73 

8.62 

7.92 

7.44 

7.08 

6.80 

6.58 



0.100 

3.07 

2.70 

2.49 

2.36 

2.27 

2.21 

2.16 

2.12 

2.09 



0.050 

4.54 

3.68 

3.29 

3.06 

2.90 

2.79 

2.71 

2.64 

2.59 



0.010 

8.68 

6.36 

5.42 

4.89 

4.56 

4.32 

4.14 

4.00 

3.89 



0.001 

16.59 

11.34 

9.34 

8.25 

7.57 

7.09 

6.74 

6.47 

6.26 



0.100 

3.05 

2.67 

2.46 

2.33 

2.24 

2.18 

2.13 

2.09 

2.06 



0.050 

4.49 

3.63 

3.24 

3.01 

2.85 

2.74 

2.66 

2.59 

2.54 



0.010 

8.53 

6.23 

5.29 

4.77 

4.44 

4.20 

4.03 

3.89 

3.78 



0.001 

16.12 

10.97 

9.01 

7.94 

7.27 

6.80 

6.46 

6.19 

5.98 



0.100 

3.03 

2.64 

2.44 

2.31 

2.22 

2.15 

2.10 

2.06 

2.03 



0.050 

4.45 

3.59 

3.20 

2.96 

2.81 

2.70 

2.61 

2.55 

2.49 



0.010 

8.40 

6.11 

5.19 

4.67 

4.34 

4.10 

3.93 

3.79 

3.68 



0.001 

15.72 

10.66 

8.73 

7.68 

7.02 

6.56 

6.22 

5.96 

5.75 

u 


0.100 

3.01 

2.62 

2.42 

2.29 

2.20 

2.13 

2.08 

2.04 

2.00 



0.050 

4.41 

3.55 

3.16 

2.93 

2.77 

2.66 

2.58 

2.51 

2.46 

G 


0.010 

8.29 

6.01 

5.09 

4.58 

4.25 

4.01 

3.84 

3.71 

3.60 

£ 

o 


0.001 

15.38 

10.39 

8.49 

7.46 

6.81 

6.35 

6.02 

5.76 

5.56 

4) 

-d 


0.100 

2.99 

2.61 

2.40 

2.27 

2.18 

2.11 

2.06 

2.02 

1.98 

"Si 


0.050 

4.38 

3.52 

3.13 

2.90 

2.74 

2.63 

2.54 

2.48 

2.42 

ii 


0.010 

8.18 

5.93 

5.01 

4.50 

4.17 

3.94 

3.77 

3.63 

3.52 



0.001 

15.08 

10.16 

8.28 

7.27 

6.62 

6.18 

5.85 

5.59 

5.39 



0.100 

2.97 

2.59 

2.38 

2.25 

2.16 

2.09 

2.04 

2.00 

1.96 



0.050 

4.35 

3.49 

3.10 

2.87 

2.71 

2.60 

2.51 

2.45 

2.39 



0.010 

8.10 

5.85 

4.94 

4.43 

4.10 

3.87 

3.70 

3.56 

3.46 



0.001 

14.82 

9.95 

8.10 

7.10 

6.46 

6.02 

5.69 

5.44 

5.24 



0.100 

2.96 

2.57 

2.36 

2.23 

2.14 

2.08 

2.02 

1.98 

1.95 



0.050 

4.32 

3.47 

3.07 

2.84 

2.68 

2.57 

2.49 

2.42 

2.37 


-1 

0.010 

8.02 

5.78 

4.87 

4.37 

4.04 

3.81 

3.64 

3.51 

3.40 



0.001 

14.59 

9.77 

7.94 

6.95 

6.32 

5.88 

5.56 

5.31 

5.11 



0.100 

2.95 

2.56 

2.35 

2.22 

2.13 

2.06 

2.01 

1.97 

1.93 



0.050 

4.30 

3.44 

3.05 

2.82 

2.66 

2.55 

2.46 

2.40 

2.34 



0.010 

7.95 

5.72 

4.82 

4.31 

3.99 

3.76 

3.59 

3.45 

3.35 



0.001 

14.38 

9.61 

7.80 

6.81 

6.19 

5.76 

5.44 

5.19 

4.99 



0.100 

2.94 

2.55 

2.34 

2.21 

2.11 

2.05 

1.99 

1.95 

1.92 



0.050 

4.28 

3.42 

3.03 

2.80 

2.64 

2.53 

2.44 

2.37 

2.32 


Lj 

0.010 

7.88 

5.66 

4.76 

4.26 

3.94 

3.71 

3.54 

3.41 

3.30 



0.001 

14.20 

9.47 

7.67 

6.70 

6.08 

5.65 

5.33 

5.09 

4.89 



0.100 

2.93 

2.54 

2.33 

2.19 

2.10 

2.04 

1.98 

1.94 

1.91 



0.050 

4.26 

3.40 

3.01 

2.78 

2.62 

2.51 

2.42 

2.36 

2.30 



0.010 

7.82 

5.61 

4.72 

4.22 

3.90 

3.67 

3.50 

3.36 

3.26 



0.001 

14.03 

9.34 

7.55 

6.59 

5.98 

5.55 

5.23 

4.99 

4.80 


(i continúa ) 
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Tabla A.9 Valores críticos para distribuciones F (continuación) 


v x = gl numerador 


10 

12 

15 

20 

25 

30 

40 

50 

60 

120 

1000 

2.14 

2.10 

2.05 

2.01 

1.98 

1.96 

1.93 

1.92 

1.90 

1.88 

1.85 

2.67 

2.60 

2.53 

2.46 

2.41 

2.38 

2.34 

2.31 

2.30 

2.25 

2.21 

4.10 

3.96 

3.82 

3.66 

3.57 

3.51 

3.43 

3.38 

3.34 

3.25 

3.18 

6.80 

6.52 

6.23 

5.93 

5.75 

5.63 

5.47 

5.37 

5.30 

5.14 

4.99 

2.10 

2.05 

2.01 

1.96 

1.93 

1.91 

1.89 

1.87 

1.86 

1.83 

1.80 

2.60 

2.53 

2.46 

2.39 

2.34 

2.31 

2.27 

2.24 

2.22 

2.18 

2.14 

3.94 

3.80 

3.66 

3.51 

3.41 

3.35 

3.27 

3.22 

3.18 

3.09 

3.02 

6.40 

6.13 

5.85 

5.56 

5.38 

5.25 

5.10 

5.00 

4.94 

4.77 

4.62 

2.06 

2.02 

1.97 

1.92 

1.89 

1.87 

1.85 

1.83 

1.82 

1.79 

1.76 

2.54 

2.48 

2.40 

2.33 

2.28 

2.25 

2.20 

2.18 

2.16 

2.11 

2.07 

3.80 

3.67 

3.52 

3.37 

3.28 

3.21 

3.13 

3.08 

3.05 

2.96 

2.88 

6.08 

5.81 

5.54 

5.25 

5.07 

4.95 

4.80 

4.70 

4.64 

4.47 

4.33 

2.03 

1.99 

1.94 

1.89 

1.86 

1.84 

1.81 

1.79 

1.78 

1.75 

1.72 

2.49 

2.42 

2.35 

2.28 

2.23 

2.19 

2.15 

2.12 

2.11 

2.06 

2.02 

3.69 

3.55 

3.41 

3.26 

3.16 

3.10 

3.02 

2.97 

2.93 

2.84 

2.76 

5.81 

5.55 

5.27 

4.99 

4.82 

4.70 

4.54 

4.45 

4.39 

4.23 

4.08 

2.00 

1.96 

1.91 

1.86 

1.83 

1.81 

1.78 

1.76 

1.75 

1.72 

1.69 

2.45 

2.38 

2.31 

2.23 

2.18 

2.15 

2.10 

2.08 

2.06 

2.01 

1.97 

3.59 

3.46 

3.31 

3.16 

3.07 

3.00 

2.92 

2.87 

2.83 

2.75 

2.66 

5.58 

5.32 

5.05 

4.78 

4.60 

4.48 

4.33 

4.24 

4.18 

4.02 

3.87 

1.98 

1.93 

1.89 

1.84 

1.80 

1.78 

1.75 

1.74 

1.72 

1.69 

1.66 

2.41 

2.34 

2.27 

2.19 

2.14 

2.11 

2.06 

2.04 

2.02 

1.97 

1.92 

3.51 

3.37 

3.23 

3.08 

2.98 

2.92 

2.84 

2.78 

2.75 

2.66 

2.58 

5.39 

5.13 

4.87 

4.59 

4.42 

4.30 

4.15 

4.06 

4.00 

3.84 

3.69 

1.96 

1.91 

1.86 

1.81 

1.78 

1.76 

1.73 

1.71 

1.70 

1.67 

1.64 

2.38 

2.31 

2.23 

2.16 

2.11 

2.07 

2.03 

2.00 

1.98 

1.93 

1.88 

3.43 

3.30 

3.15 

3.00 

2.91 

2.84 

2.76 

2.71 

2.67 

2.58 

2.50 

5.22 

4.97 

4.70 

4.43 

4.26 

4.14 

3.99 

3.90 

3.84 

3.68 

3.53 

1.94 

1.89 

1.84 

1.79 

1.76 

1.74 

1.71 

1.69 

1.68 

1.64 

1.61 

2.35 

2.28 

2.20 

2.12 

2.07 

2.04 

1.99 

1.97 

1.95 

1.90 

1.85 

3.37 

3.23 

3.09 

2.94 

2.84 

2.78 

2.69 

2.64 

2.61 

2.52 

2.43 

5.08 

4.82 

4.56 

4.29 

4.12 

4.00 

3.86 

3.77 

3.70 

3.54 

3.40 

1.92 

1.87 

1.83 

1.78 

1.74 

1.72 

1.69 

1.67 

1.66 

1.62 

1.59 

2.32 

2.25 

2.18 

2.10 

2.05 

2.01 

1.96 

1.94 

1.92 

1.87 

1.82 

3.31 

3.17 

3.03 

2.88 

2.79 

2.72 

2.64 

2.58 

2.55 

2.46 

2.37 

4.95 

4.70 

4.44 

4.17 

4.00 

3.88 

3.74 

3.64 

3.58 

3.42 

3.28 

1.90 

1.86 

1.81 

1.76 

1.73 

1.70 

1.67 

1.65 

1.64 

1.60 

1.57 

2.30 

2.23 

2.15 

2.07 

2.02 

1.98 

1.94 

1.91 

1.89 

1.84 

1.79 

3.26 

3.12 

2.98 

2.83 

2.73 

2.67 

2.58 

2.53 

2.50 

2.40 

2.32 

4.83 

4.58 

4.33 

4.06 

3.89 

3.78 

3.63 

3.54 

3.48 

3.32 

3.17 

1.89 

1.84 

1.80 

1.74 

1.71 

1.69 

1.66 

1.64 

1.62 

1.59 

1.55 

2.27 

2.20 

2.13 

2.05 

2.00 

1.96 

1.91 

1.88 

1.86 

1.81 

1.76 

3.21 

3.07 

2.93 

2.78 

2.69 

2.62 

2.54 

2.48 

2.45 

2.35 

2.27 

4.73 

4.48 

4.23 

3.96 

3.79 

3.68 

3.53 

3.44 

3.38 

3.22 

3.08 

1.88 

1.83 

1.78 

1.73 

1.70 

1.67 

1.64 

1.62 

1.61 

1.57 

1.54 

2.25 

2.18 

2.11 

2.03 

1.97 

1.94 

1.89 

1.86 

1.84 

1.79 

1.74 

3.17 

3.03 

2.89 

2.74 

2.64 

2.58 

2.49 

2.44 

2.40 

2.31 

2.22 

4.64 

4.39 

4.14 

3.87 

3.71 

3.59 

3.45 

3.36 

3.29 

3.14 

2.99 


(continúa) 
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Tabla A.9 Valores críticos para distribuciones F (continuación) 



v 1 = gl numerador 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 



0.100 

2.92 

2.53 

2.32 

2.18 

2.09 

2.02 

1.97 

1.93 

1.89 



0.050 

4.24 

3.39 

2.99 

2.76 

2.60 

2.49 

2.40 

2.34 

2.28 



0.010 

7.77 

5.57 

4.68 

4.18 

3.85 

3.63 

3.46 

3.32 

3.22 



0.001 

13.88 

9.22 

7.45 

6.49 

5.89 

5.46 

5.15 

4.91 

4.71 



0.100 

2.91 

2.52 

2.31 

2.17 

2.08 

2.01 

1.96 

1.92 

1.88 



0.050 

4.23 

3.37 

2.98 

2.74 

2.59 

2.47 

2.39 

2.32 

2.27 



0.010 

7.72 

5.53 

4.64 

4.14 

3.82 

3.59 

3.42 

3.29 

3.18 



0.001 

13.74 

9.12 

7.36 

6.41 

5.80 

5.38 

5.07 

4.83 

4.64 



0.100 

2.90 

2.51 

2.30 

2.17 

2.07 

2.00 

1.95 

1.91 

1.87 



0.050 

4.21 

3.35 

2.96 

2.73 

2.57 

2.46 

2.37 

2.31 

2.25 



0.010 

7.68 

5.49 

4.60 

4.11 

3.78 

3.56 

3.39 

3.26 

3.15 



0.001 

13.61 

9.02 

7.27 

6.33 

5.73 

5.31 

5.00 

4.76 

4.57 



0.100 

2.89 

2.50 

2.29 

2.16 

2.06 

2.00 

1.94 

1.90 

1.87 



0.050 

4.20 

3.34 

2.95 

2.71 

2.56 

2.45 

2.36 

2.29 

2.24 



0.010 

7.64 

5.45 

4.57 

4.07 

3.75 

3.53 

3.36 

3.23 

3.12 



0.001 

13.50 

8.93 

7.19 

6.25 

5.66 

5.24 

4.93 

4.69 

4.50 



0.100 

2.89 

2.50 

2.28 

2.15 

2.06 

1.99 

1.93 

1.89 

1.86 



0.050 

4.18 

3.33 

2.93 

2.70 

2.55 

2.43 

2.35 

2.28 

2.22 



0.010 

7.60 

5.42 

4.54 

4.04 

3.73 

3.50 

3.33 

3.20 

3.09 



0.001 

13.39 

8.85 

7.12 

6.19 

5.59 

5.18 

4.87 

4.64 

4.45 

u 

© 


0.100 

2.88 

2.49 

2.28 

2.14 

2.05 

1.98 

1.93 

1.88 

1.85 

'O 

a 


0.050 

4.17 

3.32 

2.92 

2.69 

2.53 

2.42 

2.33 

2.27 

2.21 

i 


0.010 

7.56 

5.39 

4.51 

4.02 

3.70 

3.47 

3.30 

3.17 

3.07 

o 

c 


0.001 

13.29 

8.77 

7.05 

6.12 

5.53 

5.12 

4.82 

4.58 

4.39 



0.100 

2.84 

2.44 

2.23 

2.09 

2.00 

1.93 

1.87 

1.83 

1.79 

ÜJD 


0.050 

4.08 

3.23 

2.84 

2.61 

2.45 

2.34 

2.25 

2.18 

2.12 



0.010 

7.31 

5.18 

4.31 

3.83 

3.51 

3.29 

3.12 

2.99 

2.89 



0.001 

12.61 

8.25 

6.59 

5.70 

5.13 

4.73 

4.44 

4.21 

4.02 



0.100 

2.81 

2.41 

2.20 

2.06 

1.97 

1.90 

1.84 

1.80 

1.76 



0.050 

4.03 

3.18 

2.79 

2.56 

2.40 

2.29 

2.20 

2.13 

2.07 


jU 

0.010 

7.17 

5.06 

4.20 

3.72 

3.41 

3.19 

3.02 

2.89 

2.78 



0.001 

12.22 

7.96 

6.34 

5.46 

4.90 

4.51 

4.22 

4.00 

3.82 



0.100 

2.79 

2.39 

2.18 

2.04 

1.95 

1.87 

1.82 

1.77 

1.74 



0.050 

4.00 

3.15 

2.76 

2.53 

2.37 

2.25 

2.17 

2.10 

2.04 



0.010 

7.08 

4.98 

4.13 

3.65 

3.34 

3.12 

2.95 

2.82 

2.72 



0.001 

11.97 

7.77 

6.17 

5.31 

4.76 

4.37 

4.09 

3.86 

3.69 



0.100 

2.76 

2.36 

2.14 

2.00 

1.91 

1.83 

1.78 

1.73 

1.69 



0.050 

3.94 

3.09 

2.70 

2.46 

2.31 

2.19 

2.10 

2.03 

1.97 



0.010 

6.90 

4.82 

3.98 

3.51 

3.21 

2.99 

2.82 

2.69 

2.59 



0.001 

11.50 

7.41 

5.86 

5.02 

4.48 

4.11 

3.83 

3.61 

3.44 



0.100 

2.73 

2.33 

2.11 

1.97 

1.88 

1.80 

1.75 

1.70 

1.66 



0.050 

3.89 

3.04 

2.65 

2.42 

2.26 

2.14 

2.06 

1.98 

1.93 



0.010 

6.76 

4.71 

3.88 

3.41 

3.11 

2.89 

2.73 

2.60 

2.50 



0.001 

11.15 

7.15 

5.63 

4.81 

4.29 

3.92 

3.65 

3.43 

3.26 



0.100 

2.71 

2.31 

2.09 

1.95 

1.85 

1.78 

1.72 

1.68 

1.64 



0.050 

3.85 

3.00 

2.61 

2.38 

2.22 

2.11 

2.02 

1.95 

1.89 



0.010 

6.66 

4.63 

3.80 

3.34 

3.04 

2.82 

2.66 

2.53 

2.43 



0.001 

10.89 

6.96 

5.46 

4.65 

4.14 

3.78 

3.51 

3.30 

3.13 


(< continúa) 
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Tabla A.9 Valores críticos para distribuciones F (continuación) 


v¡ = gl numerador 


10 

12 

15 

20 

25 

30 

40 

50 

60 

120 

1000 

1.87 

1.82 

1.77 

1.72 

1.68 

1.66 

1.63 

1.61 

1.59 

1.56 

1.52 

2.24 

2.16 

2.09 

2.01 

1.96 

1.92 

1.87 

1.84 

1.82 

1.77 

1.72 

3.13 

2.99 

2.85 

2.70 

2.60 

2.54 

2.45 

2.40 

2.36 

2.27 

2.18 

4.56 

4.31 

4.06 

3.79 

3.63 

3.52 

3.37 

3.28 

3.22 

3.06 

2.91 

1.86 

1.81 

1.76 

1.71 

1.67 

1.65 

1.61 

1.59 

1.58 

1.54 

1.51 

2.22 

2.15 

2.07 

1.99 

1.94 

1.90 

1.85 

1.82 

1.80 

1.75 

1.70 

3.09 

2.96 

2.81 

2.66 

2.57 

2.50 

2.42 

2.36 

2.33 

2.23 

2.14 

4.48 

4.24 

3.99 

3.72 

3.56 

3.44 

3.30 

3.21 

3.15 

2.99 

2.84 

1.85 

1.80 

1.75 

1.70 

1.66 

1.64 

1.60 

1.58 

1.57 

1.53 

1.50 

2.20 

2.13 

2.06 

1.97 

1.92 

1.88 

1.84 

1.81 

1.79 

1.73 

1.68 

3.06 

2.93 

2.78 

2.63 

2.54 

2.47 

2.38 

2.33 

2.29 

2.20 

2.11 

4.41 

4.17 

3.92 

3.66 

3.49 

3.38 

3.23 

3.14 

3.08 

2.92 

2.78 

1.84 

1.79 

1.74 

1.69 

1.65 

1.63 

1.59 

1.57 

1.56 

1.52 

1.48 

2.19 

2.12 

2.04 

1.96 

1.91 

1.87 

1.82 

1.79 

1.77 

1.71 

1.66 

3.03 

2.90 

2.75 

2.60 

2.51 

2.44 

2.35 

2.30 

2.26 

2.17 

2.08 

4.35 

4.11 

3.86 

3.60 

3.43 

3.32 

3.18 

3.09 

3.02 

2.86 

2.72 

1.83 

1.78 

1.73 

1.68 

1.64 

1.62 

1.58 

1.56 

1.55 

1.51 

1.47 

2.18 

2.10 

2.03 

1.94 

1.89 

1.85 

1.81 

1.77 

1.75 

1.70 

1.65 

3.00 

2.87 

2.73 

2.57 

2.48 

2.41 

2.33 

2.27 

2.23 

2.14 

2.05 

4.29 

4.05 

3.80 

3.54 

3.38 

3.27 

3.12 

3.03 

2.97 

2.81 

2.66 

1.82 

1.77 

1.72 

1.67 

1.63 

1.61 

1.57 

1.55 

1.54 

1.50 

1.46 

2.16 

2.09 

2.01 

1.93 

1.88 

1.84 

1.79 

1.76 

1.74 

1.68 

1.63 

2.98 

2.84 

2.70 

2.55 

2.45 

2.39 

2.30 

2.25 

2.21 

2.11 

2.02 

4.24 

4.00 

3.75 

3.49 

3.33 

3.22 

3.07 

2.98 

2.92 

2.76 

2.61 

1.76 

1.71 

1.66 

1.61 

1.57 

1.54 

1.51 

1.48 

1.47 

1.42 

1.38 

2.08 

2.00 

1.92 

1.84 

1.78 

1.74 

1.69 

1.66 

1.64 

1.58 

1.52 

2.80 

2.66 

2.52 

2.37 

2.27 

2.20 

2.11 

2.06 

2.02 

1.92 

1.82 

3.87 

3.64 

3.40 

3.14 

2.98 

2.87 

2.73 

2.64 

2.57 

2.41 

2.25 

1.73 

1.68 

1.63 

1.57 

1.53 

1.50 

1.46 

1.44 

1.42 

1.38 

1.33 

2.03 

1.95 

1.87 

1.78 

1.73 

1.69 

1.63 

1.60 

1.58 

1.51 

1.45 

2.70 

2.56 

2.42 

2.27 

2.17 

2.10 

2.01 

1.95 

1.91 

1.80 

1.70 

3.67 

3.44 

3.20 

2.95 

2.79 

2.68 

2.53 

2.44 

2.38 

2.21 

2.05 

1.71 

1.66 

1.60 

1.54 

1.50 

1.48 

1.44 

1.41 

1.40 

1.35 

1.30 

1.99 

1.92 

1.84 

1.75 

1.69 

1.65 

1.59 

1.56 

1.53 

1.47 

1.40 

2.63 

2.50 

2.35 

2.20 

2.10 

2.03 

1.94 

1.88 

1.84 

1.73 

1.62 

3.54 

3.32 

3.08 

2.83 

2.67 

2.55 

2.41 

2.32 

2.25 

2.08 

1.92 

1.66 

1.61 

1.56 

1.49 

1.45 

1.42 

1.38 

1.35 

1.34 

1.28 

1.22 

1.93 

1.85 

1.77 

1.68 

1.62 

1.57 

1.52 

1.48 

1.45 

1.38 

1.30 

2.50 

2.37 

2.22 

2.07 

1.97 

1.89 

1.80 

1.74 

1.69 

1.57 

1.45 

3.30 

3.07 

2.84 

2.59 

2.43 

2.32 

2.17 

2.08 

2.01 

1.83 

1.64 

1.63 

1.58 

1.52 

1.46 

1.41 

1.38 

1.34 

1.31 

1.29 

1.23 

1.16 

1.88 

1.80 

1.72 

1.62 

1.56 

1.52 

1.46 

1.41 

1.39 

1.30 

1.21 

2.41 

2.27 

2.13 

1.97 

1.87 

1.79 

1.69 

1.63 

1.58 

1.45 

1.30 

3.12 

2.90 

2.67 

2.42 

2.26 

2.15 

2.00 

1.90 

1.83 

1.64 

1.43 

1.61 

1.55 

1.49 

1.43 

1.38 

1.35 

1.30 

1.27 

1.25 

1.18 

1.08 

1.84 

1.76 

1.68 

1.58 

1.52 

1.47 

1.41 

1.36 

1.33 

1.24 

1.11 

2.34 

2.20 

2.06 

1.90 

1.79 

1.72 

1.61 

1.54 

1.50 

1.35 

1.16 

2.99 

2.77 

2.54 

2.30 

2.14 

2.02 

1.87 

1.77 

1.69 

1.49 

1.22 
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Tabla A.10 Valores críticos para distribuciones de rango estudentizado 


m 


V 

OL 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

5 

0.05 

3.64 

4.60 

5.22 

5.67 

6.03 

6.33 

6.58 

6.80 

6.99 

7.17 

7.32 


0.01 

5.70 

6.98 

7.80 

8.42 

8.91 

9.32 

9.67 

9.97 

10.24 

10.48 

10.70 

6 

0.05 

3.46 

4.34 

4.90 

5.30 

5.63 

5.90 

6.12 

6.32 

6.49 

6.65 

6.79 


0.01 

5.24 

6.33 

7.03 

7.56 

7.97 

8.32 

8.61 

8.87 

9.10 

9.30 

9.48 

7 

0.05 

3.34 

4.16 

4.68 

5.06 

5.36 

5.61 

5.82 

6.00 

6.16 

6.30 

6.43 


0.01 

4.95 

5.92 

6.54 

7.01 

7.37 

7.68 

7.94 

8.17 

8.37 

8.55 

8.71 

8 

0.05 

3.26 

4.04 

4.53 

4.89 

5.17 

5.40 

5.60 

5.77 

5.92 

6.05 

6.18 


0.01 

4.75 

5.64 

6.20 

6.62 

6.96 

7.24 

7.47 

7.68 

7.86 

8.03 

8.18 

9 

0.05 

3.20 

3.95 

4.41 

4.76 

5.02 

5.24 

5.43 

5.59 

5.74 

5.87 

5.98 


0.01 

4.60 

5.43 

5.96 

6.35 

6.66 

6.91 

7.13 

7.33 

7.49 

7.65 

7.78 

10 

0.05 

3.15 

3.88 

4.33 

4.65 

4.91 

5.12 

5.30 

5.46 

5.60 

5.72 

5.83 


0.01 

4.48 

5.27 

5.77 

6.14 

6.43 

6.67 

6.87 

7.05 

7.21 

7.36 

7.49 

11 

0.05 

3.11 

3.82 

4.26 

4.57 

4.82 

5.03 

5.20 

5.35 

5.49 

5.61 

5.71 


0.01 

4.39 

5.15 

5.62 

5.97 

6.25 

6.48 

6.67 

6.84 

6.99 

7.13 

7.25 

12 

0.05 

3.08 

3.77 

4.20 

4.51 

4.75 

4.95 

5.12 

5.27 

5.39 

5.51 

5.61 


0.01 

4.32 

5.05 

5.50 

5.84 

6.10 

6.32 

6.51 

6.67 

6.81 

6.94 

7.06 

13 

0.05 

3.06 

3.73 

4.15 

4.45 

4.69 

4.88 

5.05 

5.19 

5.32 

5.43 

5.53 


0.01 

4.26 

4.96 

5.40 

5.73 

5.98 

6.19 

6.37 

6.53 

6.67 

6.79 

6.90 

14 

0.05 

3.03 

3.70 

4.11 

4.41 

4.64 

4.83 

4.99 

5.13 

5.25 

5.36 

5.46 


0.01 

4.21 

4.89 

5.32 

5.63 

5.88 

6.08 

6.26 

6.41 

6.54 

6.66 

6.77 

15 

0.05 

3.01 

3.67 

4.08 

4.37 

4.59 

4.78 

4.94 

5.08 

5.20 

5.31 

5.40 


0.01 

4.17 

4.84 

5.25 

5.56 

5.80 

5.99 

6.16 

6.31 

6.44 

6.55 

6.66 

16 

0.05 

3.00 

3.65 

4.05 

4.33 

4.56 

4.74 

4.90 

5.03 

5.15 

5.26 

5.35 


0.01 

4.13 

4.79 

5.19 

5.49 

5.72 

5.92 

6.08 

6.22 

6.35 

6.46 

6.56 

17 

0.05 

2.98 

3.63 

4.02 

4.30 

4.52 

4.70 

4.86 

4.99 

5.11 

5.21 

5.31 


0.01 

4.10 

4.74 

5.14 

5.43 

5.66 

5.85 

6.01 

6.15 

6.27 

6.38 

6.48 

18 

0.05 

2.97 

3.61 

4.00 

4.28 

4.49 

4.67 

4.82 

4.96 

5.07 

5.17 

5.27 


0.01 

4.07 

4.70 

5.09 

5.38 

5.60 

5.79 

5.94 

6.08 

6.20 

6.31 

6.41 

19 

0.05 

2.96 

3.59 

3.98 

4.25 

4.47 

4.65 

4.79 

4.92 

5.04 

5.14 

5.23 


0.01 

4.05 

4.67 

5.05 

5.33 

5.55 

5.73 

5.89 

6.02 

6.14 

6.25 

6.34 

20 

0.05 

2.95 

3.58 

3.96 

4.23 

4.45 

4.62 

4.77 

4.90 

5.01 

5.11 

5.20 


0.01 

4.02 

4.64 

5.02 

5.29 

5.51 

5.69 

5.84 

5.97 

6.09 

6.19 

6.28 

24 

0.05 

2.92 

3.53 

3.90 

4.17 

4.37 

4.54 

4.68 

4.81 

4.92 

5.01 

5.10 


0.01 

3.96 

4.55 

4.91 

5.17 

5.37 

5.54 

5.69 

5.81 

5.92 

6.02 

6.11 

30 

0.05 

2.89 

3.49 

3.85 

4.10 

4.30 

4.46 

4.60 

4.72 

4.82 

4.92 

5.00 


0.01 

3.89 

4.45 

4.80 

5.05 

5.24 

5.40 

5.54 

5.65 

5.76 

5.85 

5.93 

40 

0.05 

2.86 

3.44 

3.79 

4.04 

4.23 

4.39 

4.52 

4.63 

4.73 

4.82 

4.90 


0.01 

3.82 

4.37 

4.70 

4.93 

5.11 

5.26 

5.39 

5.50 

5.60 

5.69 

5.76 

60 

0.05 

2.83 

3.40 

3.74 

3.98 

4.16 

4.31 

4.44 

4.55 

4.65 

4.73 

4.81 


0.01 

3.76 

4.28 

4.59 

4.82 

4.99 

5.13 

5.25 

5.36 

5.45 

5.53 

5.60 

120 

0.05 

2.80 

3.36 

3.68 

3.92 

4.10 

4.24 

4.36 

4.47 

4.56 

4.64 

4.71 


0.01 

3.70 

4.20 

4.50 

4.71 

4.87 

5.01 

5.12 

5.21 

5.30 

5.37 

5.44 

00 

0.05 

2.77 

3.31 

3.63 

3.86 

4.03 

4.17 

4.29 

4.39 

4.47 

4.55 

4.62 


0.01 

3.64 

4.12 

4.40 

4.60 

4.76 

4.88 

4.99 

5.08 

5.16 

5.23 

5.29 
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Apéndice/Tablas 683 


Tabla A.11 Curvas c/i/'-cuadrada para áreas de cola 


Área cola superior 

v = 1 

v = 2 

v = 3 

v = 4 

v = S 

> 0.100 

< 2.70 

< 4.60 

< 6.25 

< 7.77 

< 9.23 

0.100 

2.70 

4.60 

6.25 

7.77 

9.23 

0.095 

2.78 

4.70 

6.36 

7.90 

9.37 

0.090 

2.87 

4.81 

6.49 

8.04 

9.52 

0.085 

2.96 

4.93 

6.62 

8.18 

9.67 

0.080 

3.06 

5.05 

6.75 

8.33 

9.83 

0.075 

3.17 

5.18 

6.90 

8.49 

10.00 

0.070 

3.28 

5.31 

7.06 

8.66 

10.19 

0.065 

3.40 

5.46 

7.22 

8.84 

10.38 

0.060 

3.53 

5.62 

7.40 

9.04 

10.59 

0.055 

3.68 

5.80 

7.60 

9.25 

10.82 

0.050 

3.84 

5.99 

7.81 

9.48 

11.07 

0.045 

4.01 

6.20 

8.04 

9.74 

11.34 

0.040 

4.21 

6.43 

8.31 

10.02 

11.64 

0.035 

4.44 

6.70 

8.60 

10.34 

11.98 

0.030 

4.70 

7.01 

8.94 

10.71 

12.37 

0.025 

5.02 

7.37 

9.34 

11.14 

12.83 

0.020 

5.41 

7.82 

9.83 

11.66 

13.38 

0.015 

5.91 

8.39 

10.46 

12.33 

14.09 

0.010 

6.63 

9.21 

11.34 

13.27 

15.08 

0.005 

7.87 

10.59 

12.83 

14.86 

16.74 

0.001 

10.82 

13.81 

16.26 

18.46 

20.51 

< 0.001 

> 10.82 

> 13.81 

> 16.26 

> 18.46 

> 20.51 

Área cola superior 

v = 6 

V = 1 

i> = 8 

v = 9 

v= 10 

> 0.100 

< 10.64 

< 12.01 

< 13.36 

< 14.68 

< 15.98 

0.100 

10.64 

12.01 

13.36 

14.68 

15.98 

0.095 

10.79 

12.17 

13.52 

14.85 

16.16 

0.090 

10.94 

12.33 

13.69 

15.03 

16.35 

0.085 

11.11 

12.50 

13.87 

15.22 

16.54 

0.080 

11.28 

12.69 

14.06 

15.42 

16.75 

0.075 

11.46 

12.88 

14.26 

15.63 

16.97 

0.070 

11.65 

13.08 

14.48 

15.85 

17.20 

0.065 

11.86 

13.30 

14.71 

16.09 

17.44 

0.060 

12.08 

13.53 

14.95 

16.34 

17.71 

0.055 

12.33 

13.79 

15.22 

16.62 

17.99 

0.050 

12.59 

14.06 

15.50 

16.91 

18.30 

0.045 

12.87 

14.36 

15.82 

17.24 

18.64 

0.040 

13.19 

14.70 

16.17 

17.60 

19.02 

0.035 

13.55 

15.07 

16.56 

18.01 

19.44 

0.030 

13.96 

15.50 

17.01 

18.47 

19.92 

0.025 

14.44 

16.01 

17.53 

19.02 

20.48 

0.020 

15.03 

16.62 

18.16 

19.67 

21.16 

0.015 

15.77 

17.39 

18.97 

20.51 

22.02 

0.010 

16.81 

18.47 

20.09 

21.66 

23.20 

0.005 

18.54 

20.27 

21.95 

23.58 

25.18 

0.001 

22.45 

24.32 

26.12 

27.87 

29.58 

< 0.001 

> 22.45 

> 24.32 

> 26.12 

> 27.87 

> 29.58 

(continúa) 
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684 Apéndice/Tablas 


Tabla A.11 Curvas c/i/'-cuadrada para áreas de cola (continuación) 


Área cola superior 

v = 11 

v = 12 

v = 13 

v = 14 

v = 15 

> 0.100 

< 17.27 

< 18.54 

< 19.81 

< 21.06 

< 22.30 

0.100 

17.27 

18.54 

19.81 

21.06 

22.30 

0.095 

17.45 

18.74 

20.00 

21.26 

22.51 

0.090 

17.65 

18.93 

20.21 

21.47 

22.73 

0.085 

17.85 

19.14 

20.42 

21.69 

22.95 

0.080 

18.06 

19.36 

20.65 

21.93 

23.19 

0.075 

18.29 

19.60 

20.89 

22.17 

23.45 

0.070 

18.53 

19.84 

21.15 

22.44 

23.72 

0.065 

18.78 

20.11 

21.42 

22.71 

24.00 

0.060 

19.06 

20.39 

21.71 

23.01 

24.31 

0.055 

19.35 

20.69 

22.02 

23.33 

24.63 

0.050 

19.67 

21.02 

22.36 

23.68 

24.99 

0.045 

20.02 

21.38 

22.73 

24.06 

25.38 

0.040 

20.41 

21.78 

23.14 

24.48 

25.81 

0.035 

20.84 

22.23 

23.60 

24.95 

26.29 

0.030 

21.34 

22.74 

24.12 

25.49 

26.84 

0.025 

21.92 

23.33 

24.73 

26.11 

27.48 

0.020 

22.61 

24.05 

25.47 

26.87 

28.25 

0.015 

23.50 

24.96 

26.40 

27.82 

29.23 

0.010 

24.72 

26.21 

27.68 

29.14 

30.57 

0.005 

26.75 

28.29 

29.81 

31.31 

32.80 

0.001 

31.26 

32.90 

34.52 

36.12 

37.69 

< 0.001 

> 31.26 

> 32.90 

> 34.52 

> 36.12 

> 37.69 

Área cola superior 

v = 16 

v= 17 

v = 18 

v= 19 

v = 20 

> 0.100 

< 23.54 

< 24.77 

< 25.98 

< 27.20 

< 28.41 

0.100 

23.54 

24.76 

25.98 

27.20 

28.41 

0.095 

23.75 

24.98 

26.21 

27.43 

28.64 

0.090 

23.97 

25.21 

26.44 

27.66 

28.88 

0.085 

24.21 

25.45 

26.68 

27.91 

29.14 

0.080 

24.45 

25.70 

26.94 

28.18 

29.40 

0.075 

24.71 

25.97 

27.21 

28.45 

29.69 

0.070 

24.99 

26.25 

27.50 

28.75 

29.99 

0.065 

25.28 

26.55 

27.81 

29.06 

30.30 

0.060 

25.59 

26.87 

28.13 

29.39 

30.64 

0.055 

25.93 

27.21 

28.48 

29.75 

31.01 

0.050 

26.29 

27.58 

28.86 

30.14 

31.41 

0.045 

26.69 

27.99 

29.28 

30.56 

31.84 

0.040 

27.13 

28.44 

29.74 

31.03 

32.32 

0.035 

27.62 

28.94 

30.25 

31.56 

32.85 

0.030 

28.19 

29.52 

30.84 

32.15 

33.46 

0.025 

28.84 

30.19 

31.52 

32.85 

34.16 

0.020 

29.63 

30.99 

32.34 

33.68 

35.01 

0.015 

30.62 

32.01 

33.38 

34.74 

36.09 

0.010 

32.00 

33.40 

34.80 

36.19 

37.56 

0.005 

34.26 

35.71 

37.15 

38.58 

39.99 

0.001 

39.25 

40.78 

42.31 

43.81 

45.31 

< 0.001 

> 39.25 

> 40.78 

> 42.31 

> 43.81 

> 45.31 
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Apéndice/Tablas 685 


Tabla A.12 Valores críticos para la prueba de normalidad Ryan-Joiner 



a 


0.10 

0.05 

0.01 


5 

0.9033 

0.8804 

0.8320 

10 

0.9347 

0.9180 

0.8804 

15 

0.9506 

0.9383 

0.9110 

20 

0.9600 

0.9503 

0.9290 

25 

0.9662 

0.9582 

0.9408 

30 

0.9707 

0.9639 

0.9490 

40 

0.9767 

0.9715 

0.9597 

50 

0.9807 

0.9764 

0.9664 

60 

0.9835 

0.9799 

0.9710 

75 

0.9865 

0.9835 

0.9757 
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686 Apéndice/Tablas 

Tabla A.13 Valores críticos para la prueba Wilcoxon de rangos con signo P 0 (S + > c,) = P(S + > c, cuando H 0 es verdadera) 


11 

<4 

P¿S + — Cj) 

n 

c i 

P„(S + — c i) 

3 

6 

0.125 


78 

0.011 

4 

9 

0.125 


79 

0.009 


10 

0.062 


81 

0.005 

5 

13 

0.094 

14 

73 

0.108 


14 

0.062 


74 

0.097 


15 

0.031 


79 

0.052 

6 

17 

0.109 


84 

0.025 


19 

0.047 


89 

0.010 


20 

0.031 


92 

0.005 


21 

0.016 

15 

83 

0.104 

7 

22 

0.109 


84 

0.094 


24 

0.055 


89 

0.053 


26 

0.023 


90 

0.047 


28 

0.008 


95 

0.024 

8 

28 

0.098 


100 

0.011 


30 

0.055 


101 

0.009 


32 

0.027 


104 

0.005 


34 

0.012 

16 

93 

0.106 


35 

0.008 


94 

0.096 


36 

0.004 


100 

0.052 

9 

34 

0.102 


106 

0.025 


37 

0.049 


112 

0.011 


39 

0.027 


113 

0.009 


42 

0.010 


116 

0.005 


44 

0.004 

17 

104 

0.103 

10 

41 

0.097 


105 

0.095 


44 

0.053 


112 

0.049 


47 

0.024 


118 

0.025 


50 

0.010 


125 

0.010 


52 

0.005 


129 

0.005 

11 

48 

0.103 

18 

116 

0.098 


52 

0.051 


124 

0.049 


55 

0.027 


131 

0.024 


59 

0.009 


138 

0.010 


61 

0.005 


143 

0.005 

12 

56 

0.102 

19 

128 

0.098 


60 

0.055 


136 

0.052 


61 

0.046 


137 

0.048 


64 

0.026 


144 

0.025 


68 

0.010 


152 

0.010 


71 

0.005 


157 

0.005 

13 

64 

0.108 

20 

140 

0.101 


65 

0.095 


150 

0.049 


69 

0.055 


158 

0.024 


70 

0.047 


167 

0.010 


74 

0.024 


172 

0.005 
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Apéndice/Tablas 687 


Tabla A.14 Valores críticos para la prueba Wilcoxon de suma de rangos p 0 (W>c ) 

= P(W £ c cuando H 0 

es verdadera) 

m n 

c 

7yw> C ) 

m n 

c 

Po(W>c) 

3 3 

15 

0.05 


40 

0.004 

4 

17 

0.057 

6 

40 

0.041 


18 

0.029 


41 

0.026 

5 

20 

0.036 


43 

0.009 


21 

0.018 


44 

0.004 

6 

22 

0.048 

7 

43 

0.053 


23 

0.024 


45 

0.024 


24 

0.012 


47 

0.009 

7 

24 

0.058 


48 

0.005 


26 

0.017 

8 

47 

0.047 


27 

0.008 


49 

0.023 

8 

27 

0.042 


51 

0.009 


28 

0.024 


52 

0.005 


29 

0.012 

6 6 

50 

0.047 


30 

0.006 


52 

0.021 

4 4 

24 

0.057 


54 

0.008 


25 

0.029 


55 

0.004 


26 

0.014 

7 

54 

0.051 

5 

27 

0.056 


56 

0.026 


28 

0.032 


58 

0.011 


29 

0.016 


60 

0.004 


30 

0.008 

8 

58 

0.054 

6 

30 

0.057 


61 

0.021 


32 

0.019 


63 

0.01 


33 

0.010 


65 

0.004 


34 

0.005 

7 7 

66 

0.049 

7 

33 

0.055 


68 

0.027 


35 

0.021 


71 

0.009 


36 

0.012 


72 

0.006 


37 

0.006 

8 

71 

0.047 

8 

36 

0.055 


73 

0.027 


38 

0.024 


76 

0.01 


40 

0.008 


78 

0.005 


41 

0.004 

8 8 

84 

0.052 

5 5 

36 

0.048 


87 

0.025 


37 

0.028 


90 

0.01 


39 

0.008 


92 

0.005 
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688 Apéndice/Tablas 


Tabla A.15 Valores críticos para el intervalo Wilcoxon de rangos con signo (■"W+Ofl-c+l). ■*(<:)) 


11 

Nivel de 
confianza (%) 

c 

11 

Nivel de 
confianza (%) 

c 

n 

Nivel de 
confianza (%) 

c 

5 

93.8 

15 

13 

99.0 

81 

20 

99.1 

173 


87.5 

14 


95.2 

74 


95.2 

158 

6 

96.9 

21 


90.6 

70 


90.3 

150 


93.7 

20 

14 

99.1 

93 

21 

99.0 

188 


90.6 

19 


95.1 

84 


95.0 

172 

7 

98.4 

28 


89.6 

79 


89.7 

163 


95.3 

26 

15 

99.0 

104 

22 

99.0 

204 


89.1 

24 


95.2 

95 


95.0 

187 

8 

99.2 

36 


90.5 

90 


90.2 

178 


94.5 

32 

16 

99.1 

117 

23 

99.0 

221 


89.1 

30 


94.9 

106 


95.2 

203 

9 

99.2 

44 


89.5 

100 


90.2 

193 


94.5 

39 

17 

99.1 

130 

24 

99.0 

239 


90.2 

37 


94.9 

118 


95.1 

219 

10 

99.0 

52 


90.2 

112 


89.9 

208 


95.1 

47 

18 

99.0 

143 

25 

99.0 

257 


89.5 

44 


95.2 

131 


95.2 

236 

11 

99.0 

61 


90.1 

124 


89.9 

224 


94.6 

55 

19 

99.1 

158 





89.8 

52 


95.1 

144 




12 

99.1 

71 


90.4 

137 





94.8 

64 








90.8 

61 
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Tabla A.16 Valores críticos para el intervalo Wilcoxon de suma de rangos 


Apéndice/Tablas 689 

(dij( mn -c+ 1): d¡j( c )) 


Tamaño muestral más pequeño 


Tamaño mués! 
más grande 

5 


6 

7 

8 

ral Nivel de 
confianza (%) 

c 

Nivel de 
confianza (%) 

c 

Nivel de 
confianza (%) 

c 

Nivel de 
confianza (%) 

c 

5 

99.2 

25 








94.4 

22 








90.5 

21 







6 

99.1 

29 

99.1 

34 






94.8 

26 

95.9 

31 






91.8 

25 

90.7 

29 





7 

99.0 

33 

99.2 

39 

98.9 

44 




95.2 

30 

94.9 

35 

94.7 

40 




89.4 

28 

89.9 

33 

90.3 

38 



8 

98.9 

37 

99.2 

44 

99.1 

50 

99.0 

56 


95.5 

34 

95.7 

40 

94.6 

45 

95.0 

51 


90.7 

32 

89.2 

37 

90.6 

43 

89.5 

48 

9 

98.8 

41 

99.2 

49 

99.2 

56 

98.9 

62 


95.8 

38 

95.0 

44 

94.5 

50 

95.4 

57 


88.8 

35 

91.2 

42 

90.9 

48 

90.7 

54 

10 

99.2 

46 

98.9 

53 

99.0 

61 

99.1 

69 


94.5 

41 

94.4 

48 

94.5 

55 

94.5 

62 


90.1 

39 

90.7 

46 

89.1 

52 

89.9 

59 

11 

99.1 

50 

99.0 

58 

98.9 

66 

99.1 

75 


94.8 

45 

95.2 

53 

95.6 

61 

94.9 

68 


91.0 

43 

90.2 

50 

89.6 

57 

90.9 

65 

12 

99.1 

54 

99.0 

63 

99.0 

72 

99.0 

81 


95.2 

49 

94.7 

57 

95.5 

66 

95.3 

74 


89.6 

46 

89.8 

54 

90.0 

62 

90.2 

70 


Tamaño muestral más pequeño 



9 


10 

11 

12 

Tamaño muestral Nivel de 


Nivel de 


Nivel de 


Nivel de 


más grande 

confianza (%) 

c 

confianza (%) 

c 

confianza (%) 

c 

confianza (%) 

c 

9 

98.9 

69 








95.0 

63 








90.6 

60 







10 

99.0 

76 

99.1 

84 






94.7 

69 

94.8 

76 






90.5 

66 

89.5 

72 





11 

99.0 

83 

99.0 

91 

98.9 

99 




95.4 

76 

94.9 

83 

95.3 

91 




90.5 

72 

90.1 

79 

89.9 

86 



12 

99.1 

90 

99.1 

99 

99.1 

108 

99.0 

116 


95.1 

82 

95.0 

90 

94.9 

98 

94.8 

106 


90.5 

78 

90.7 

86 

89.6 

93 

89.9 

101 
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Respuestas a ejercicios 
seleccionados de número impar 


Capítulo 1 


1. a. Los Angeles Times, Oberlin Tribune, Gainesville Sun, 
Washington Post. 

b. Duke Energy, Clorox, Seagate, Neiman Marcus 

c. Vince Correa, Catherine Miller, Michael Cutler, Ken Lee 

d. 2,97,3.56,2.20,2.97 

3. a. ¿Qué tan probable es que más de la mitad de las compu¬ 
tadoras muestreadas necesiten o hayan necesitado servicio 
en garantía? ¿Cuál es el número esperado entre los 100 que 
necesitan servicio en garantía? ¿Qué tan probable es que el 
número que necesita servicio en garantía sea mayor que 
el número esperado en más de 10? 

b. Suponga que 15 de las 100 muestreadas necesitaban ser¬ 
vicio en garantía. ¿Qué confianza podemos tener de que la 
proporción de todas las computadoras que necesitan servicio 
en garantía sea entre 0.08 y 0.22? ¿La muestra proporciona 
evidencia obligatoria para concluir que más del 10% de esas 
computadoras necesitan servicio en garantía? 

5. a. No. Todos los estudiantes que toman un curso grande de 
estadística que participan en un programa del SI de esta clase. 

b. La aleatorización protege contra sesgos diversos y ayuda 
a asegurar que los del grupo SI son tan semejantes como es 
posible a los estudiantes del grupo de control. 

c. No habría base firme para evaluar la efectividad del SI 
(nada a que las calificaciones del SI pudieran compararse ra¬ 
zonablemente). 

7. Uno podría generar una muestra aleatoria sencilla de todas 
las casas unifamiliares de la ciudad, o una muestra aleatoria 
estratificada al tomar una muestra aleatoria sencilla de cada 
uno de los 10 vecindarios del distrito. De cada una de las ca¬ 
sas seleccionadas, se determinarían valores de todas las va¬ 
riables deseadas. Este sería un estudio enumerativo porque 
existe una población de objetos finita e identificable de la 
cual tomar muestras. 


9. a. Posiblemente error de medición, error de registro, dife¬ 
rencias en condiciones ambientales en el momento de la me¬ 
dición, etcétera. 

b. No. No hay marco de muestreo. 


11. 6L 

430 

6H 

769689 

7L 

42014202 

7H 


8L 

011211410342 

8H 

9595578 

9L 

30 

9H 

58 


La brecha en los datos, no hay calificaciones en los 70 altos. 

13. a. 12 2 hoja: dígito de unidades 

12 445 
12 6667777 

12 889999 

13 00011111111 

13 222222222233333333333333 
13 44444444444444444455555555555555555555 
13 6666666666667777777777 

13 888888888888999999 

14 0000001111 
14 2333333 

14 444 
14 77 
Simetría 

b. Cerca de la forma de campana, centro ~ 135, no disper¬ 
sión insignificante, no brechas ni valores aislados. 


691 
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15. Crujiente 


644 

77220 

6320 

222 

55 

0 


Cremoso 

2 

0069 

00145 

003666 

258 


tallo: decenas 
hoja: unidades 


Ambos conjuntos de calificaciones están más bien dispersos. 
Parece que no hay valores aislados. La distribución de cali¬ 
ficaciones crujientes parece haberse trasladado a la derecha 
(hacia valores más grandes) de la de calificaciones cremosas 
por algo del orden de 10. 


Clase 

Frec. 

Frec. Reí. 

Densidad 

0-<50 

8 

0.08 

0.0016 

50-C100 

13 

0.13 

0.0026 

100-C150 

11 

0.11 

0.0022 

150-<200 

21 

0.21 

0.0042 

200-<300 

26 

0.26 

0.0026 

300-<400 

12 

0.12 

0.0012 

400-<500 

4 

0.04 

0.0004 

500-<600 

3 

0.03 

0.0003 

600-<900 

2 

0.02 

0.00007 


100 

LOO 



17. a. # No se apega Frecuencia Frec. Reí. 25. Clase 


Frec. Clase 


Frec. 


0 

7 

0.117 

1 

12 

0.200 

2 

13 

0.217 

3 

14 

0.233 

4 

6 

0.100 

5 

3 

0.050 

6 

3 

0.050 

7 

1 

0.017 

8 

J. 

0.017 


60 

1.001 


b. 0.917, 0.867, 1 - 0.867 = 0.133 


10-<20 

8 

1.1—<1.2 

2 

20-<30 

14 

1.2-<1.3 

6 

30-<40 

8 

1.3—<1.4 

7 

40-<50 

4 

1.4—<1.5 

9 

50-<60 

3 

1.5—<1.6 

6 

60-<70 

2 

1.6—<1.7 

4 

70-<80 

1 

1.7—<1.8 

5 


40 

1.8—<1.9 

1 


40 

Original: positivamente sesgado; 

Transformado: mucho más simétrico, no lejos de forma de 


c. El histograma tiene un sesgo positivo considerable. Está 
centrado en un punto entre 2 y 3 y se dispersa bastante alre¬ 
dedor de su centro. 

19. a. 0.99 (99%), 0.71 (71%) b. 0.64 (64%), 0.44 (44%) 
c. Estrictamente hablando, el histograma no es unimodal, 
pero está cerca de serlo con un sesgo positivo moderado. Es 
probable que un tamaño muestral mucho más grande diera 
una imagen más tersa. 


y 

Frec. 

Frec. Reí. 

b. z 

Frec. 

Frec. Reí. 

0 

17 

0.362 

0 

13 

0.277 

i 

22 

0.468 

1 

11 

0.234 

2 

6 

0.128 

2 

3 

0.064 

3 

1 

0.021 

3 

7 

0.149 

4 

0 

0.000 

4 

5 

0.106 

5 

1 

0.021 

5 

3 

0.064 


47 

1.000 

6 

3 

0.064 

0.362, 0.638 

7 

0 

0.000 




8 

2 

0.043 





47 

1.001 




0.894, 0.830 

Clase 

Frec. 

Frec. Reí. 




0-<100 

21 

0.21 

100-<200 

32 

0.32 

200-<300 

26 

0.26 

300-<400 

12 

0.12 

400-<500 

4 

0.04 

500-<600 

3 

0.03 

600-<700 

1 

0.01 

700-<800 

0 

0.00 

800-<900 

1 

0.01 


100 

LOO 


campana. 

27. a. La observación 50 cae en una frontera de clase. 


b. Clase 

Frec. 

Frec. Reí. 

0-<50 

9 

0.18 

50-<100 

19 

0.38 

100-<150 

11 

0.22 

150-<200 

4 

0.08 

200-<300 

4 

0.08 

300-<400 

2 

0.04 

400-<500 

0 

0.00 

500-<600 

J_ 

0.02 


50 

LOO 

Un valor representativo (central) está un poco abajo o un po¬ 
co arriba de 100, dependiendo de cómo se mida el centro. 
Hay gran variabilidad en los tiempos de vida, en especial en 
valores del extremo superior de los datos. Hay varios candi- 

datos para valores aislados. 


c. Clase 

Frec. 

Frec. Reí. 


2.25-<2.75 

2 

0.04 

2.75-<3.25 

2 

0.04 

3.25-<3.75 

3 

0.06 

3.75-<4.25 

8 

0.16 

4.25-<4.75 

18 

0.36 

4.75-<5.25 

10 

0.20 

5.25-<5.75 

4 

0.08 

5.75-<6.25 

_3 

0.06 


50 

LOO 


Hay mucha más simetría en la distribución de los valores 
ln(.v) que en los valores x en sí, y menos variabilidad. Ya no 
hay brechas ni valores aislados obvios, 
d. 0.38, 0.14 
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29. Queja Frec. Frec. Reí. 


J 10 0.1667 

F 9 0.1500 

B 7 0.1167 

M 4 0.0667 

C 3 0.0500 

N 6 0.1000 

O 21 0.3500 

60 1.0001 


31. Clase 

Frec. 

Frec. Acum. 

Frec. Acum. Reí. 

0-<4 

2 

2 

0.050 

4-<8 

14 

16 

0.400 

8—< 12 

11 

27 

0.675 

12—< 16 

8 

35 

0.875 

16-<20 

4 

39 

0.975 

20-<24 

0 

39 

0.975 

24-<28 

1 

40 

1.000 

33. a. x = 192.57, x = 

189.0 


b. Nueva x 

= 189.71; x sin cambio 


c. 191.0,7.14% 

d. 122.6 


35. a. x = 12.55, x = 12.50, jc tr(125) = 12.40. Borrar la observa¬ 
ción más grande (18.0) hace que x y x tt sean un poco meno- 

res que x. 

b. En casi 4.0 

c. No; multiplique los valores de x y x. por el 


factor de conversión 1/2.2. 


39. a. 3c = 1.0297, x = 1.009 b. 0.383 
41. a. 0.7 b. También 0.7 c. 13 
43. x = 68.0, x tr(20 ) = 66.2, T tr(30) = 67.5 

45. a. x = 115.58; las desviaciones son 0.82, 0.32,- 0.98, 
- 0.38, 0.22 

b. 0.482, 0.694 c. 0.482 d. 0.482 

47. x = 116.2, i = 25.75. La magnitud de í indica una cantidad 
importante de variación alrededor del centro (una desviación 
“representativa” de casi 25). 


49. a. 56.80, 197.8040 
51. a. 1264.766, 35.564 


b. 0.5016, 0.708 
b. 0.351,0.593 


53. a. 2.74,3.88 b. 1.14 c. Sin cambio 
d. A lo sumo 0.40 e. 1.19 

55. a. 33 b. No 

c. Un ligero sesgo positivo en la mitad central, pero más 
bien simétrico en su conjunto. La magnitud de variabilidad 
parece importante. 

d. A lo sumo 32 


57. a. Sí. 125.8 es un valor aislado extremo y 250.2 es un valor 
aislado moderado. 

b. Además de la presencia de valores aislados, hay sesgo 
positivo tanto en el 50% central de los datos como en gene¬ 
ral, excepto los valores aislados. Con excepción de los dos 
valores aislados, parece haber una cantidad relativamente 
pequeña de variabilidad en los datos. 


Respuestas a ejercicios seleccionados de número impar 693 

59. a. DE (delirio excitado): 0.4, 0.10, 2.75, 2.65; 

No DE: 1.60, 0.30, 7.90,7.60 

b. DE: 8.9 y 9.2 son valores aislados moderados, y 11.7 y 
21.0 son valores aislados extremos. 

No hay valores aislados en la muestra sin delirio excitado, 
c. Cuatro valores aislados para DE. ninguno para no DE. Sesgo 
positivo importante en ambas muestras; menos variabilidad 
en DE (para f s menor), y las observaciones para no DE tien¬ 
den a ser un poco mayores que las observaciones con DE. 
61. Valores aislados, moderados y extremos, sólo a las 6 a.m. 
Las distribuciones a otras horas son bastante simétricas. La 
variabilidad aumenta un poco hasta las 2 p.m. y luego dismi¬ 
nuye ligeramente, y lo mismo es cierto de valores “típicos” 
de coeficiente de vapor de gasolina. 


6 

34 

7 

17 

8 

4589 

9 

1 

10 

12667789 

11 

122499 

12 

2 

13 

1 


x = 9.96, x = 10.6, i = 1.7594,/, = 2.3, no hay valores ais¬ 
lados, sesgo negativo. 

65. a. Valor representativo = 90. Razonablemente simétrica, 
unimodal, un poco en forma de campana, buena cantidad de 
variabilidad. 

b. 0.9231,0.9053 

c. 0.48 

67. a. M: x = 3.64, x = 3.70, i = 0.269,/, = 0.40 
F: T = 3.28, x = 3.15, i = 0.478,/, = 0.50 
Los valores femeninos son por lo general un poco menores 
que los masculinos, y muestran un poco de más variabilidad. 
Un gráfica de caja M muestra sesgo negativo, mientras que 
una gráfica de caja F muestra sesgo positivo, 
b. F: Ttr(io) = 3.24 M: Ttr(io) = 3.652 ~ 3.65 

69. a. y = ax + b, s 2 = a 2 s 2 x b. 189.14. 1.87 

71. a. La media, mediana y media recortada son prácticamente 
idénticas, lo que sugiere una cantidad importante de simetría 
en la información; el hecho que los cuarteles estén a casi la 
misma distancia desde la mediana, y que las observaciones 
máximas sean casi equidistantes del centro, proporciona más 
apoyo para simetría. La desviación estándar es bastante pe¬ 
queña con respecto a la media y mediana, 
b. Vea los comentarios de a). Además, usando 1.5(Q3 - Ql) 
como medida, las dos observaciones más grandes y las tres 
más pequeñas son valores aislados moderados. 

73. x = 0.9255, s = 0.0809, x = 0.93, pequeña cantidad de va¬ 
riabilidad, un poco de sesgo. 

75. a. Los “resúmenes de cinco números” ( x, los dos cuartos, y 
las observaciones más pequeña y más grande) son idénticas 
y no hay valores aislados, de modo que las tres gráficas de 
caja individuales son idénticas. 

b. Diferencias en variabilidad, naturaleza de brechas, y 
existencia de grupos para tres muestras. 

c. No. Se pierde el detalle. 
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77. a. 0 
1 
2 

3 

4 

5 

6 
7 


2355566777888 

0000135555 

00257 

0033 

0057 tallo: unidades 

044 hoja: decenas 

05 


9 0 

10 3 

HI 22.0,24.5 


b. Clase 

Frec. 

Frec. Reí. 

Densidad 

0-<2 

23 

0.500 

0.250 

2-<4 

9 

0.196 

0.098 

4-<6 

7 

0.152 

0.076 

6-<10 

4 

0.087 

0.022 

10-<20 

1 

0.022 

0.002 

20-<30 

2 

0.043 

0.004 

a. x n+1 = ( nx n + 
c. 12.53,0.532 

x n+ i)/(n + 1) 




81. Un sesgo positivo importante (suponiendo unimodalidad). 

83. a. Todos los puntos caen en una recta de 45°. 

b. Caen puntos debajo de la recta de 45°, indicando un 
sesgo positivo importante. 


Capítulo 2 


1. a. T= {1324, 3124, 1342, 3142, 1423, 1432, 4123, 4132, 
2314, 2341, 3214, 3241, 2413, 2431, 4213, 4231) 

b. A = {1324, 1342, 1423, 1432} 

c. B = {2314, 2341, 3214, 3241, 2413, 2431, 4213, 4231} 

d. AU«= {1324, 1342, 1423, 1432, 2314, 2341, 3214, 
3241,2413,2431,4213,4231), 

Aflfino contiene resultados {Ay B son disjuntos), 

A' = {3124, 3142, 4123, 4132, 2314, 2341, 3214, 3241, 
2413, 2431. 4213, 4231) 

3. a. A = {SSF, SFS, FSS) 

b. S = {SSF, SFS, FSS, SSS) 

c. C= {SFS, SSF, SSS) 

d. C' = {FFF, FSF, FFS, FSS, SFF), 

A U C = {SSF, SFS, FSS, SSS), 

A n C = {SSF, SFS), 

B U C = {SSF, SFS, FSS, SSS) = B, 

BDC= {SSF, SFS, SSS) = C 

5. a. T = {(1, 1,1), (1,1, 2), (1, 1, 3), (1, 2,1), (1, 2, 2), (1, 2, 3), 
(1, 3, 1), (1, 3, 2), (1, 3, 3), (2, 1, 1), (2, 1, 2), (2, 1, 3), 
(2, 2,1), (2, 2, 2), (2, 2, 3), (2, 3,1), (2, 3, 2), (2, 3, 3), (3,1,1), 
(3, 1, 2), (3, 1, 3), (3, 2, 1), (3, 2, 2), (3, 2, 3), (3, 3, 1), 
(3, 3, 2), (3, 3, 3)) b. {(1, 1, 1), (2, 2, 2), (3, 3, 3)} 

c. {(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)} 

d. {(1, 1, 1), (1, 1, 3), (1, 3, 1), (1, 3, 3), (3, 1, 1), (3, 1, 3), 
(3, 3, 1), (3, 3, 3)} 


7. a. Flay 35 resultados 

en S. b. {AABABAB, AABAABB, 

AAABBAB, AAABABB, AAAABBB} 

11. a. 0.07 

b. 0.30 

c. 0.57 

13. a. 0.36 

b. 0.64 

c. 0.53 

d. 0.47 

e. 0.17 

f. 0.75 

15. a. 0.572 

b. 0.879 


17. a. Hay paquetes computarizados de estadística además de 

SPSS y SAS 



b. 0.70 

c. 0.80 

d. 0.20 


19. 

21 . 

23. 

25. 

27. 

29. 

31. 

33. 

35. 

37. 

39. 

41. 

43. 

45. 

47. 

49. 

51. 

53. 

55. 

59. 

61. 

63. 

65. 


a. 0.8841 

a. 0.10 
e. 0.31 

a. 0.067 
a. 0.98 
a. 0.1 


b. 0.0435 

b. 0.18,0.19 
f. 0.69 


c. 0.41 


d. 0.59 


b. 0.400 c. 0.933 d. 0.533 
b. 0.02 c. 0.03 d. 0.24 
b. 0.7 c. 0.6 


a. 676; 1296 b. 17576:46656 c. 456976; 
1679 616 d. 0.942 

a. 243 b. 364 días (casi 10 años) 

a. 362,880 b. 131,681,894,400 c. 2100 

a. 0.0048 b. 0.0054 c. 0.9946 d. 0.2885 

a. 60 b. 10 c. 0.0456 

a. 0.0839 b. 0.24975 

a. 0.929 b. 0.0714 c. 0.99997520 

0.000394, 0.00394, 0.00001539 

a. 0.447, 0.500, 0.200 b. 0.400, 0.447 c. 0.211 

a. 0.50 b. 0.50 c. 0.625 

d. 0.375 e. 0.769 

0.217, 0.178 
0.436, 0.581 
0.083 
0.236 

a. 0.21 b. 0.455 

a. 0.578,0.278,0.144 

b. 0.54 c. 0.68 


c. 0.264, 0.274 
b. 0, .457, 0.543 
d. 0.74 e. 0.7941 


«Media | S ) = 0.3922, «Media | S ) = 0.2941, de modo que 
Media y Mediana son la más y la menos probable, respecti¬ 
vamente. 


67. 0.000329; muy incómodo. 
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69. a. 0.126 b. 0.05 c. 0.1125 d. 0.2725 
e. 0.5325 f. 0.2113 

71. a. 0.300 b. 0.820 c. 0.146 

75. 0.401,0.722 

77. a. 0.06235 b. 0.00421 

79. 0.0059 

81. a. 0.95 

83. a. 0.10,0.20 b. 0 

85. a. p{ 2 — p) b. 1 — (1 — p) n c. (1 — p) 3 

d. 0.9 + (1 - p) 3 (0.1) 

e. 0.1(1 - p) 3 /[0.9 + 0.1(1 - p) 3 ] = 0.0137 para p = 0.5 
87. 0.8588,0.9897 

89. [2-17(1 - tt)]/( 1 - iT 2 ) 

91. a. 0.333, 0.444 b. 0.150 c. 0.291 


93. 0.45,0.32 

95. a. 0.0083 b. 0.2 c. 0.2 
97. 0.905 

99. a. 0.956 b. 0.994 
101. 0.926 

103. a. 0.018 b. 0.601 

105. a. 0.883,0.117 b. 23 c. 0.156 

107. 1 - (1 - Pl )(l -p 2 ).(1 -p„) 

109. a. 0.0417 b. 0.375 

111. /'(contratar #1) = 6/24 para 5 = 0, = 11/24 para 5=1, 
= 10/24 para s = 2, y = 6/24 para 5 = 3, de modo que 5 = 
1 es mejor. 

113. 1/4 = P(A l n A, n A 3 ) 

* P(A r) • P(Ai) ■ P(AJ = 1/8 


Capítulo 3 


1. x = 0 para FFF; x = 1 para SFF, FSF, y FFS; x = 2 para 
SSF, SFS y FSS; y x = 3 para SSS 

3. Z = promedio de los dos números, con posibles valores 2/2, 
3/2, . . ., 12/2; W = valor absoluto de la diferencia, con valores 
posibles 0, 1, 2, 3, 4, 5 

5. No. En el Ejemplo 3.4, sea Y = 1 si a lo sumo se examinan 
tres baterías y sea Y = 0 de otro modo. Entonces Y tiene sólo 
dos valores. 

7. a. {0, 1, . . ., 12}; discreta c. [1, 2, 3, . . .} discreta 
e. {0, c, 2c, . .., 10,000c}, donde c es la regalía por libro; dis¬ 
creta g. [x: m £ x £ M} donde m(M) es la tensión 
mínima (máxima) posible; continua. 

9. a. {2, 4, 6, 8, . . .}, es decir, (2(1), 2(2), 2(3), 2(4),. . .} una 
sucesión infinita; discreta. 

b. {2, 3, 4, 5, 6, . . .}, es decir, {1 + 1, 1 + 2, 1 + 3, 1 + 4, . . .} 
una succión infinita o, discreta. 

11. a. p(4) = 0.45, p(6) = 0.40, p(8) = 0.15, p(x) = 0 para 
x =/= 4, 6 o 8 c. 0.55, 0.15 

13. a. 0.70 b. 0.45 c. 0.55 

d. 0.71 e. 0.65 f. 0.45 

15. a. (1, 2), (1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), 
(3, 5), (4, 5) b. p(0) = 0.3, p(l) = 0.6, p(2) = 0.1 

c. F(x) = 0 para x < 0, = 0.3 para 0 £ x < 1, = 0.9 para 
1 < x < 2 = 1 para 2 < x 

17. a. 0.81 b. 0.162 c. Es A; AUUUA, UAUUA, 
UUAUA, UUUAA; 0.00405 

19. p(0) = 0.09, p(l) = 0.40, p(2) = 0.32, p(3) = 0.19 

21. a. p(x) = 0.301, 0.176, 0.125, 0.097, 0.079, 0.067, 0.058, 
0.051, 0.046 parax = 1, 2, . . ., 9 

b. F(x) = 0 para x < 1, = 0.477 para 1 < x < 2, = 0.602 
para 2 < x < 3,..., = 0.954 para 8 £ x < 9, = 1 para x a 9 

c. 0.602,0.301 


23. 

25. 

27. 


29. 


31. 


33. 


35. 


37. 


39. 


43. 


47. 

49. 

51. 


53. 


55. 

57. 

59. 


61. 


63. 


65. 


a. 0.20 b. 0.33 c. 0.78 d. 0.53 
a. p(y) = (1 — pY • p para y = 0, 1, 2, 3, . . . 

a. 1234, 1243, 1324,. . ., 4321 

b. p{ 0) = 9/24, p(l) = 8/24, p( 2) = 6/24, p( 3) = 0, 
p{ 4) = 1/24 

a. 2.06 b. 0.9364 c. 0.9677 d. 0.9364 

0.74, 0.8602, 0.85 

a. p b. p( 1 - p) c. p 

E[h 3 (X)\ = 2.4667, E[h 4 (X)] — 2.667, así que 4 copias es 
mejor. 

E(X) = (n + 1 )/2, E(X 2 ) = (n + l)(2n + l)/6, V{X) = 
(n 2 - 1)/12 

2.3,0.81, 88.5, 20.25 

E(X - c) = E(X ) - c, E(X - p) = 0 

a. 0.515 b. 0.218 c. 0.011 d. 0.480 
e. 0.965 f. 0.000 g. 0.595 

a. 0.354 b. 0.115 c. 0.918 

a. 6.25 b. 2.17 c. 0.030 

a. 0.403 b. 0.787 c. 0.774 

0.1478 

0.407, independencia 

a. 0.017 b. 0.811,0.425 c. 0.006, 0.902,0.586 

Cuando p = 0.9, la probabilidad es 0.99 para A y 0.9963 para 
B. Si p = 0.5, estas probabilidades son 0.75 y 0.6875, respec¬ 
tivamente. 

La tabulación para p > 0.5 es innecesaria, 
a. 20, 16 b. 70, 21 
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67. P(\X — /j, | > 2cr) = 0.042 cuando p = 0.5 y = 0.65 cuando 
p = 0.75, en comparación con el límite superior de 0.25. 
Usando k = 3 en lugar de k = 2, estas probabilidades son 
0.002 y 0.004, respectivamente, mientras que el límite supe¬ 
rior es 0.11. 


69.a.0.114 b. 0.879 c. 0.121 d. Use la distribu¬ 
ción binomial con n = 15, p — 0.10 

71. a. /r(x; 15, 10, 20) para x = 5, . . ., 10 

b. 0.0325 c. 0.697 


73. a. h(x; 10, 10, 20) b 

75. a. nb(x; 2, 0.5) b. 0. 

77. nb(x; 6, 0.5), 6 

79. a. 0.932 b. 0.065 

e. 0.251 

81. a. 0.011 b. 0.441 

83. Poisson(5) a. 0.492 

85. a. 0.122,0.809,0.283 

c. 0.530,0.011 

87. a. 0.099 b. 0.135 


. 0.033 

188 c. 0.688 d. 2,4 

c. 0.068 d. 0.492 

c. 0.554, 0.459 d. 0.945 
b. 0.133 
b. 12,3.464 


89. a. 4 b. 0.215 c. Al menos-ln(0.1)/2 « 1.1513 años 
91. a. 0.221 b. 6,800,000 c. p(x; 20.106) 

95. b. 3.114,0.405,0.636 

97. a. b{x; 15, 0.75) b. 0.686 

c. 0.313 d. 11.25, 2.81 e. 0.310 

99. 0.991 

101. a. p{x; 2.5) b. 0.067 c. 0.109 
103. 1.813,3.05 

105. p{ 2 ) = p\ p{ 3 ) = (1 - p)p 2 , p( 4 ) = (1 - p)p 2 , p(x) = 
[1 — p( 2) — ■ ■ • — p(x — 3)](1 — p)p 2 para x = 5, 6, 
7,...; 0.99950841 

107. a. 0.0029 b. 0.0767,0.9702 

109. a. 0.135 b. 0.00144 c. Z" =0 \p(x; 2)] 5 

111. 3.590 

113. a. No b. 0.0273 

115. b. 0.6p(x; A) + 0.4 p(x; p.) c. (A + /r)/2 

d. (A - p.) 2 / 4 + (A + /x)/2 

117. 2 ¿'üi (//■+,■+] + p¡_j_ 1 )p¡, donde p k = 0 si k < 0 o k > 10. 

121. a. 2.50 b. 3.1 


Capítulo 4 


1. a. 0.25 b. 0.50 c. 0.4375 

3. b. 0.5 c. 0.6875 d. 0.6328 

5. a. 0.375 b. 0.125 c. 0.297 d. 0.578 

7. a. /(x) = 0.1 para 25 £ x £ 35 y 0 de otro modo 

b. 0.20 c. 0.40 d. 0.20 

9. a. 0.562 b. 0.438, 0.438 c. 0.071 

11. a. 0.25 b. 0.1875 c. 0.9375 d. 1.4142 

e. /(x) = x/2 para 0 < x < 2 

f. 1.33 g. 0.222, 0.471 h. 2 

13. a. 3 b. 0 para x £ 1, 1 — x 3 para x > 1 

c. 0.125, 0.088 d. 1.5, 0.866 e. 0.924 

y- 9 v 10 

15. a. F(x) = 0 para x £ 0, = 90[y — ^] para 0<x<l,= 
1 para x a 1 b. 0.0107 c. 0.0107, 0.0107 

d. 0.9036 e. 0.818, 0.111 f. 0.3137 

17. a. A + (B - A)p b. E(X) = (A + 5)/2, <r x = 

(B - A)/V12 c. [B" + 1 -A n+ ']/[(« + 1 )(B - A)] 

19. a. 0.597 b. 0.369 

c. /(x) = 0.3466 — 0.25 ln(x) para 0 < x < 4 

21. 314.79 
23. 248, 3.60 


25. 

27. 

29. 

31. 


33. 


35. 

37. 


39. 


41. 

43. 

45. 

47. 

49. 


b. 1.8(90avo percentil paraX) + 32 

c. a(X percentil) + b 

0, 1.814 

a. 2.14 b. 0.81 c. 1.17 

d. 0.97 e. 2.41 

a. 2.54 b. 1.34 c. -0.42 

a. 0.9918 b. 0.0082 c. 0.8664 

a. 0.3336 b. Aproximadamente 0 

c. 0.5795 d. 6.524 e. 0.8028 

a. 0,0.5793,0.5793 b. 0.3174, no c. < 87.6 o > 120.4 
a. 36.7 b. 22.225 c. 3.179 
0.002 
10 , 0.2 
7.3% 

21.155 

a. 0.1190, 0.6969 b. 0.0021 c. 0.7054 

d. >5020 o <1844 (usando z 00 oo 5 = 3.295) 

e. Normal, p. = 7.576, a = 1.064, 0.7054 
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51. 0.3174 para k = 1, 0.0456 para k = 2,0.0026 para k = 3, en com¬ 
paración con los límites de 1, 0.25, y 0.111, respectivamente. 
53. a. Exacta: 0.212, 0.577, 0.573; Aproximada: 0.211, 0.567, 
0.596 b. Exacta: 0.885, 0.575, 0.017; Aproximada: 
0.885, 0.579, 0.012 c. Exacta: 0.002, 0.029, 0.617; Apro¬ 
ximada: 0.003, 0.033, 0.599 

55. a. 0.9409 b. 0.9943 

57. b. Normal, p. = 239, a 2 = 12.96 

59. a. 1 b. 1 c. 0.982 d. 0.129 

61. a. 0.449,0.699,0.148 b. 0.05,0.018 

63. a. corto =>• plan #1 mejor, mientras que largo =»■ plan #2 mejor 

b. 1\A = 10 => E[/¡| ( X )] = 100, E [h 2 (X)\ = 112.53 
1\A = 15 => E[/ij (X)] = 150, E\h 2 (X)\ = 138.51 

65. a. 0.238 b. 0.238 c. 0.313 d. 0.653 e. 0.653 
f. 0.713 

67. a. 0.424 b. 0.567, p < 24 c. 60 d. 66 

69. a. fl A¡ b. Exponencial con A = 0.05 

c. Exponencial con parámetro «A 

73. a. 0.826, 0.826, 0.0636 b. 0.664 c. 172.727 
77. a. 123.97,117.373 b. 0.5517 c. 0.1587 

79. a. 68.0, 122.1 b. 0.3204 

c. 0.7257, sesgo 

81.a. 149.157,223.595 b. 0.9573 c. 0.0414 

d. 148.41 e. 9.57 f. 125.90 

83. a = j8 

85. b. [I> + j8) • T(m + j8)]/[T(a + j3 + trí) ■ p/(a + jS) 
87. Sí, porque el patrón en la gráfica es bastante lineal. 

89. Sí 
91. Sí 

93. Trazar ln(x) vs. percentil. La figura es recta, de modo que es 
plausible una distribución poblacional lognormal. 

95. La figura en la gráfica es bastante lineal; es muy plausible 
que la resistencia sea distribuida normalmente. 
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97. Hay una curvatura importante en la gráfica. A es un 
parámetro de escala (como es cr para la familia normal). 

99. a. F(y) = ¿-(y 2 - y 3 /18) para 0 < y < 12 

b. 0.259, 0.5, 0.241 c. 6, 43.2, 7.2 
d. 0.518 e. 3.75 

101 . a. /(x) = x 1 para 0 ^ jc < 1 y = — \x para 1 < x £ | 

b. 0.917 c. 1.213 

103. a. 0.9162 b. 0.9549 c. 1.3374 

105. a. 0.3859 b. 0.0663 c. (72.97, 119.03) 

107. b. F(x) = 0 para x < — 1, = (4x — x 2 13)19 + yy para 

— l<x:£2y=l para x > 2 

c. No. F(0) <0.5^p>0 

d. Y ~ Bin(10, yy) 

109. a. 0.368,0.828,0.460 b. 352.53 

c. 1/jS • exp[—exp (—(x — a)/¡ 3)] • exp(—(x — a)//3) 

d. a e. p. = 201.95, moda = 150, p = 182.99 

111. a. ¡x b. No c. 0 

d. {a — l)/3 e. v — 2 

113. b. p( 1 — exp(—A pe)) + (1 — p)(l — exp(—A jí)) para ,t£0 

c. p/\¡ + (1 — p)t A 2 

d. V(X) = 2p/A 2 + 2(1 - p)¡\\ - p 2 

e. 1, CV> 1 f. CV< 1 

115. a. Lognormal b. 1 c. 2.72, 0.0185 

119. a. Exponencial con A = 1 

c. Gama con parámetros ay c¡3 

121. a. (1/365) 3 b. (1/365) 2 c. 0.000002145 

123. b. Sea u v u 2 , « 3 , . . . una sucesión de observaciones de una 
distribución Unif[0, 1] (una sucesión de números aleatorios). 
Entonces con x¡ = ( — 0.1)ln(l — u¡), las x¡ son observacio¬ 
nes de una distribución exponencial con A = 10. 

125. g(E(X)) < E(g{X)) 

127. a. 710,84.423,0.684 b. 0.376 


Capítulo 5 


1. a. 0.20 b. 0.42 c. Al menos una manguera está en 
uso en cada bomba; 0.70. d. p x (x) = 0.16, 0.34, 0.50 
para x = 0, 1, 2, respectivamente; p Y {y) = 0.24, 0.38, 0.38 
para y = 0, 1, 2, respectivamente; 0.50 e. No; p{ 0, 0) A 

Px( 0) ’ M°) 

3. a. 0.15 b. 0.40 c. 0.22 d. 0.17, 0.46 

5. a. 0.054 b. 0.00018 

7. a. 0.030 b. 0.120 c. 0.300 

d. 0.380 e. Sí 

9. a. 3/380,000 b. 0.3024 c. 0.3593 
d. 10& 2 + 0.05 para 20 £ x £ 30 e. No 


11. a. e A ^ • A* ■ p y /x\y\ b. e x M • [1 + A + ¿u,] 

c. e -(A+ ' i) • (A + p.) m /m\\ Poisson (A + p.) 

13. a. e~ x ~ y para x > 0, y s 0 b. 0.400 c. 0.594 

d. 0.330 

15. a. F{y) = 1 - e~ Áy + (1 - e“^) 2 - (1 - e - ^) 3 para y > 0 
b. 2/3A 

17. a. 0.25 b. 0.318 c. 0.637 

d. fü(x) = 2V/? 2 — x 2 h tR 2 para —R < x < i?; no 

19. a. K(x 2 + f)l(WKx 2 + 0.05); K(x 2 + y 2 )l(\0Ky 2 + 0.05) 
b. 0.556, 0.549 c. 25.37, 2.87 
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21. a. /( x¡, x 2 , x 3 )/f x¡iXi (x j, x 2 ) b. /(Xj, x 2 , xj/fxfa) 

23. 0.15 
25. L 1 2 
27. 0.25 hr 

29. 

31. a. -0.1082 b. -0.0131 


X 

25 32.5 40 45 52.5 65 

p(x ) 

0.04 0.20 0.25 0.12 0.30 0.09 


s 2 

0 

112.5 

312.5 

800 

p(s 2 ) 

0.38 

0.20 

0.30 

0.12 


Proporción 

0 

0.1 

0.2 

0.3 

0.4 

0.5 

Probabilidad 

0.000 

0.000 

0.000 

0.001 

0.005 

0.027 



Proporción 


0.6 

0.7 

0.8 

0.9 

1.0 


Probabilidad 


0.088 

0.201 

0.302 

0.269 

0.107 

41. 

a. x 

1 

1.5 

2 

2.5 3 

3.5 

4 


p(x ) 

0.16 

0.24 

0.25 

0.20 0.10 

0.04 

0.01 


b. 0.85 

c. r 


0 

1 

2 

3 



p{r) 

0.30 

0.40 

0.22 

0.08 

47. 

a. 0.6826 

b. 

0.1056 





49. 

a. 0.6026 

b 

0.2981 





51. 

0.7720 







53. 

a. 0.0062 

b. 

0 






55. a. 0.9838 b. 0.8926 
57. 0.9616 


e 


59. a. 0.9986,0.9986 b. 0.9015,0.3970 

c. 0.8357 d. 0.9525, 0.0003 

61. a. 3.5,2.27,1.51 b. 15.4,75.94,8.71 

63. a. 0.695 b. 4.0675 > 2.6775 
65. a. 0.9232 b. 0.9660 
67. 0.1588 

69. a. 2400 b. 1205; independencia c. 2400,41.77 

71. a. 158, 430.25 b. 0.9788 

73. a. Aproximadamente normal con media = 105, DE = 1.2649; 
aproximadamente normal con media = 100; DE = 1.0142 

b. Aproximadamente normal con media = 5, DE = 1.6213 

c. 0.0068 d. 0.0010, sí 

75. a. 0.2, 0.5, 0.3 para x = 12, 15, 20; 0.10, 0.35, 0.55 para 
y = 12,15, 20 b. 0.25 c. No d. 33.35 e. 3.85 

77. a. 3/81,250 b. f x (x) = k(250x - 10x 2 ) para 0 < x < 

1 

20; f x (x) = k( 450x - 30x 2 + yx 3 ) para 20 < x < 30; f r (y) 
resulta de sustituir v por x en f Y (x). No son independientes, 
c. 0.355 d. 25.969 
e. 204.6154, -0.894 f. 7.66 

79. « 1 

81. a. 400 min b. 70 
83. 97 
85. 0.9973 

89. b, c. Ji cuadrada con v = n. 

91. a. o-y/o- 2 , + o- 2 ) b. 0.9999 
93. 26, 1.64 

95. a. 0.6 b. U = pX + Vi - p 2 Y 


Capítulo 6 


1. a. 8.14, X b. 0.77, X c. 1.66,5 

d. 0.148 e. 0.204, S/X 

3. a. 1.348, X b. 1.348, X 

c. 1.781, X + 1.285 

d. 0.6736 e. 0.0905 


5. 

7. 

9. 

11 . 


Nx = 1,703,000; T — Nd = 1,591,300; T-(xly) = 
1,601,438.281 

a. 120.6 b. 1,206,000 c. 0.80 d. 120.0 
a. 2.11 b. 0.119 


b. 


P\ c l\ PiQi 


c. Use p¡ = x i ln i yq i = 1 - p¡ 


en lugar de p¡ y q¡ en la parte b) para i = 1,2. 


d. -0.245 e. 0.041 


15. a. 0 =Y.X]l2n b. 74.505 
17. b. 0.444 

19. a. p = 2A - 0.30 = 0.20 b. p = (100Á - 9)/70 
21. b. a = 5, )3 = 28.0/r(1.2) 

23. Aj = x, A, = y, estimación de (Aj — A,) es x — y. 

25. a. 384.4, 18.86 b. 415.42 

29. a. 6 = mínlA,.), Á = n/EfZ,. - mín(A,.)] 
b. 0.64,0.202 

33. Con x¡ = tiempo entre nacimiento i — 1 y nacimiento i, A = 
6/2)f=i ix¡ = 0.0436. 

35. 29.5 
37. 1.0132 
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Capítulo 7 


1. a. 99.5% b. 85% c. 2.96 d. 1.15 
3. a. Más angosto b. No c. No d. No 

5.3.(4.52,5.18) b. (4.12, 5.00) 
c. 0.55 d. 94 

7. Por un factor de 4; el ancho se reduce en un factor de 5. 

9. a. (x - 1.645oVVn, °o); (4.57, oo) 

b. (x — z a • ar/y/ñ , oo) c. (—oo, x + z a • cr/Vñ); 
(-oo, 59.7) 

11. 950,0.8714 

13. a. (608.58,699.74) b. 189 
15. a. 80% b. 98% c. 75% 

17. 134.53 
19. (0.513,0.615) 

21. 0.218 

23. a. (0.438,0.814) b. 659 

25. a. 381 b. 339 

29. a. 2.228 b. 2.086 c. 2.845 d. 2.680 

e. 2.485 f. 2.571 

31. a. 1.812 b. 1.753 c. 2.602 d. 3.747 

e. 2.1716 (de MINITAB) f. Alrededor de 2.43 

33. a. Cantidad razonable de simetría, sin valores aislados 

b. Sí (con base en una gráfica normal de probabilidad) 

c. (430.5, 446.1), sí, no 


35. a. 95% IC: (23.1, 26.9) 

b. 95% IP: (17.2, 32.8), casi 4 veces el ancho 

37. a. (0.888, .964) b. (0.752, 1.100) 

c. (0.634, 1.218) 

39. a. Sí b. (6.45,98.01) 
c. (18.63, 85.83) 

41. Todos 70%; c) porque es más corto 

43. a. 18.307 b. 3.940 c. 0.95 d. 0.10 

45. (3.6, 8.1); no 

47. a. 95% IC: (6.702, 9.456) b. (0.166,0.410) 

49. a. Parece haber un ligero sesgo positivo en la mitad central 
de la muestra, pero el bigote inferior es mucho más largo que 
el bigote superior. La magnitud de la variabilidad es más 
bien importante, aun cuando no haya resultados aislados. 

b. Sí. La figura de puntos en una gráfica de probabilidad 
normal es razonablemente lineal. 

c. (33.53,43.79) 

51. a. (0.624, 0.732) b. 1080 c. No 
53. (-0.84, -0.16) 

55. 246 

57. (2t r /x¡- a i2, 2r , 2t r / X 2 al2 ,2r) = (65.3, 232.5) 

59. a. (máx(.Y ( .)/(l — ct/2) 1 * * * * * 7 * 9 * 11 ", máx(x¡)/(a/2) 1,n ) 

b. (máx(v ; ), m’dx(x¡)/a l,n ) c. (b); (4.2, 7.65) 

61. (73.6, 78.8) contra (75.1, 79.6) 


Capítulo 8 


1. a. Sí b. No c. No 

d. Sí e. No f. Sí 

5. H ü \ a = 0.05 contra H a : cr < 0.05. I: concluya que la varia¬ 

bilidad en grosor es satisfactoria cuando no lo es. II: conclu¬ 

ya que la variabilidad en grosor no es satisfactoria cuando de 

hecho lo es. 

7. I: concluyendo que la planta no se apega cuando sí se apega; 

II: concluyendo que la planta se apega cuando de hecho no 
se apega. 

9. a. R¡ b. I: juzgando que una de las dos compañías es 
favorecida sobre la otra cuando ése no es el caso; II: juzgando 
que ninguna compañía es favorecida sobre la otra cuando de 
hecho una de ellas es realmente preferida. c. 0.044 

d. j8(0.3) = jS(0.7) = 0.488, jB(0.4) = 0(0.6) = 0.845 

e. Rechazar H 0 a favor de H á . 

11. a. H 0 : /jl = 10 versus // a : ¡x A 10 b. 0.01 
c. 0.5319, 0.0078 d. 2.58 

e. 10.1032 se sustituye con 10.124, y 9.8968 se sustituye 
con 9.876. f. x = 10.020, de modo que H 0 no debe ser 
rechazada. 

g. z s 2.58 o — —2.58 


13. 

b. 

0.0004, 0, menos de 0.01 

15. 

a. 

0.0301 

b. 0.003 c. 0.004 

17. 

a. 

z = 2.56 

a 2.33, y rechazar H ü . b. 0.8413 c. 143 


d. 

0.0052 


19. 

a. 

z = —2.27, y no rechazar H a . b. 0.2266 c. 22 

21. 

a. 

? 0.025,12 

2.179 > 1.6, y no rechazar H 0 : ¡jl = 0.5. 


b. 

-1.6 > 

—2.179, y no rechazar H 0 . 


c. No rechazar H 0 . 

d. Rechazar H 0 a favor de H¿. ¡l A 0.5. 

23. 1 = 2.24 a 1.708, así H 0 debe rechazarse. La información no 
sugiere una contradicción de creencia anterior. 

25. a. z = —3.33 £—2.58, y rechazar H 0 . 
b. 0.1056 c. 217 

27. a. y = 0.750, x = 0.640, j = 0.3025 J s = 0.480. Una gráfi¬ 
ca de caja muestra importante sesgo positivo; no hay valores ais¬ 
lados. 

b. No. Una gráfica de probabilidad normal muestra curva¬ 
tura importante. No, porque n es grande. 
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c. z — — 5.79; rechazar H 0 a cualquier nivel razonable de 
significación; sí. d. 0.821 

29. a. 0.498 < 1.895, y no rechazar H 0 . b. 0.72 

31. —1.24 > —1.397, y la creencia anterior no parece contra¬ 
decirse. 

35. Sí, porque —2.47 £ —1.96. 

37. z = 3.67 > 2.58, y rechazar H 0 : p = 0.40. No. 

39. a. H 0 : p = 0.02 vs Hp p < 0.02, z =-1.01 > -1.645, no 
rechazar H 0 , realizar inventario. b. 0.1949 

c. ~ 0 

41. a. z = 3.07 > 2.58, rechazar H 0 y la premisa de la compañía. 

b. 0.0332 

43. No, no, sí. R = {5, 6, ... , 24, 25}, a = 0.098, J3 = 0.090 

45. a. Rechazar H a . b. Rechazar H 0 . 

c. No rechazar H 0 . d. Rechazar H 0 (una llamada cercana) 
e. No rechazar H 0 . 

47. a. 0.0778 b. 0.1841 c. 0.0250 

d. 0.0066 e. 0.5438 

49. a. 0.40 b. 0.018 c. 0.130 d. 0.653 

e. <0.005 f. «0.000 

51. Valor P > a, y no rechazar H ü \ no hay diferencia aparente. 

53. Valor P < 0.0004 < 0.01, y rechazar H 0 : p = 5 debe ser 
rechazada a favor de 7/ a : p # 5. 

55. No; Valor P « 0.2 


57. t ~ 1.9, de modo que el valor P ~ 0.041. Como el valor P £ 

a , H 0 : p = 25 debe ser rechazada a favor de 77 a : p > 25. 

59. t ~ 1.9, de modo que el valor P ~ 0.116. Por lo tanto, H 0 no 
debe ser rechazada. 

61. a. 0.8980,0.1049,0.0014 b. valor P « 0. Sí. c. No 
63. z = —3.12 ^ —1.96, de modo que H 0 debe ser rechazada. 
65. a. H 0 : p = 0.85 contra W a : p V 0.85 

b. H 0 no puede ser rechazada por ninguna a. 

67. a. Sí, porque t = 12.9 £ 2.228. 
b. Distribución poblacional normal 

69. a. No; no 

b. No, porque z = 0.44 y valor P = 0.33 > 0.10. 

71. a. Aproximadamente 0.6; aproximadamente 0.2 (de la Tabla 
A. 17 del Apéndice) b. n = 28 
73. a. z = 1.64 < 1 .96, de modo que H a no puede ser rechaza¬ 
da; tipo II b. 0.10. Sí. 

75. Sí. z = — 3.32 £ — 3.08, de modo que H 0 debe rechazarse. 
77. No, porque z = 1.33 < 2.05. 

79. Valor P ~ 0, y rechazar H Q \ parece que p > 15. 

81. a. 0.01 < valor P < 0.025, de modo que no se rechace H 0 \ 
no extradición 

83. a. Para H 2 : p < p 0 , rechazar H 0 si zE x¡/p 0 £ Xi-c., 2 n 
b. Valor estadístico de prueba = 19.65 > 8.260, y no recha¬ 
zar H 0 . 

85. a. Sí, a = 0.002 


Capítulo 9 


1. a. —0.4 hr; no depende b. 0.0724, 0.2691 c. No 

3. z = 1.76 < 2.33, de modo que no rechace H 0 . 

5. a. z = —2.90, y rechace H 0 . b. 0.0019 

c. 0.8212 d. 66 

7. Sí, porque z = 1.83 a 1.645. 

9. a. 6.2; sí b. z = 1.14, valor P ~ 0.25, no 

c. No d. Un intervalo de confianza de 95% IC es (10.0, 
21 . 8 ). 

11. Un intervalo de confianza de 95% es (0.99, 2.41) 

13. 50 

15. b. Aumenta. 

17. a. 17 b. 21 c. 18 d. 26 

19. t = —1.20 > — í 0 oi 9 = “2.821. no rechazar/7 0 . 

21. Sí; —2.64 £ —2.602, y rechazar H 0 . 

23. b. No c. t = —0.38 > —t a/2 10 para cualquier a razona¬ 
ble, no rechazar H 0 (valor P ~ 0.7). 

25. (0.3, 6.1), sí, sí 

27. (6.5, 31.3) con base en 9 grados de libertad; sí, sí 


29. t = — 2.10, gl = 25, valor P = 0.023. Al nivel de significa¬ 
ción 0.05, concluiríamos que la cola resulta en un promedio 
de resistencia más alto, pero no al nivel de significación 0.01. 

31. a. Centros prácticamente idénticos, sustancialmente más 
variabilidad en observaciones de rango medio que en observa¬ 
ciones de rango más alto. 

b. ( — 7.9, 9.6), con base en 23 grados de libertad; no 
33. t = 1.33, valor P = 0.094, no rechazar H 0 , no 

35. t = — 2.2, grados de libertad =16, valor P = 0.021 > 0.01 
= a, de modo que no se rechace H 0 . 

37. a. (-0.561,-0.287) b. Entre -1.224 y 0.376 

39. a. Sí 

b. t = 2.7, valor P = 0.018 < 0.05 = a, de modo que no se 
rechace H 0 . 

41. t = 1.9, valor P = 0.047. H 0 no puede ser rechazada al nivel 
de significación 0.01, pero es apenas rechazada en a = 0.05. 

45. a. Un intervalo de confianza de 95%: ( —2.52, 1.05); plau¬ 
sible que sean idénticos. 

b. El patrón lineal en prueba no pasada implica que la dis¬ 
tribución de diferencia en normalidad es plausible. 






















resp_p691-709.qxd 3/12/08 4:45 AM Page 701 



47. H 0 es rechazada porque — 4.18 £ — 2.33. 

49. Valor P = 0.4247, de modo que H 0 no puede ser rechazada. 
51. a. z = 0.80 < 1.96, y no rechazar H 0 . 

b. n = 1211. 

53. a. El intervalo de confianza para ln(0) is ln(0) ± z o/2 [(tn — 
x)/(mx) + (n — y)/(ny)] 1/2 . Al tomar los antilogaritmos de 
los límites inferior y superior da un intervalo de confianza 
para 8 misma. 

b. (1.43, 2.31); parece que la aspirina es benéfica. 

55. (-0.35,0.07) 

57. a. 3.69 b. 4.82 c. 0.207 d. 0.271 
e. 4.30 f. 0.212 g. 0.95 h. 0.94 
59. /= 0.384; como 0.167 < 0.384 < 3.63, no rechazar H 0 . 

61. / = 2.85 £ 2.08, así que rechace H 0 ; no parece haber más 
variabilidad en aumento de peso en dosis baja. 

63. (siF t _ an /sl s\F nn ls\)- (0.023, 1.99) 

65. No. í = 3.2, gl = 15, valor P = 0.006, y rechace H 0 : p l — 
p-, = 0 usando ya sea a = 0.05 o 0.01. 

67. z > 0 => valor P > 0.5, así que PI 0 : — p 2 = 0 no puede ser 
rechazada. 

69. (-299.3, 1517.9) 
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71. (1024.0, 1336.0), sí 

73. Sí. t = -2.25, gl = 57, valor P = 0.028 

75. a. No. t = -2.84, gl = 18, valor P = 0.012 
b. No. t = —0.56, valor P ~ 0.29 

77. No al nivel de significación 0.05. t — —1.76 > —í 0054 = 
-2.015 

79. No, ni debe usarse la prueba t de dos muestras, porque una 
gráfica de probabilidad normal sugiere que la distribución de 
buena visibilidad no es normal. 

81. No agrupado: gl = 15, t = —1.8, valor P ~ 0.092 
Agrupado: gl = 24, t = —1.9, valor P ~ 0.070 

83. a. m = 141, n= 47 b. m = 240, n= 160 

85. z = 0.83, valor P ~ 0.20, no. 

87. 0.9015, 0.8264, 0.0294, 0.0000; promedios verdaderos de 
los CI; no 

89. Sí; z = 4.2, valor P « 0 

91. a. Sí. t = — 6.4, gl = 57, y valor P ~ 0 
b. t = 1.1, valor P = 0.14, y no rechazar H 0 . 

93. (-1.29, -0.59) 


Capítulo 10 


1. a. /= 1.85 < 3.06 = F 0054 1J , de modo que no rechace H 0 . 
b. Valor P> 0.10 

3. /= 1.30 < 2.57 = Fq 10221’ de modo que el valor P > 0.10. 
H 0 no puede ser rechazada a ningún nivel razonable de sig¬ 
nificación. 

5. /= 1.73 < 5.49 = F ümn ^, por lo que no parecen diferir 
las tres calificaciones. 

7. /= 1.70 < 2.46 = F 010316 , y el valor P > 0.10. Fl 0 no pue¬ 
de ser rechazada a ningún nivel razonable de significación. 

9- /— 3.96 y ío. 05 , 3,20 = 3.10 < 3.96 < 4.94 = ío.01,3,20’ así que 
0.01 < valor P < 0.05. Entonces H 0 puede ser rechazada al 
nivel de significación 0.05; parece haber diferencias entre 
los granos. 

11. w = 36.09 3 1 4 2 5 

437.5 462.0 469.3 512.8 532.1 

Las marcas 2 y 5 parecen no diferir, ni parece haber diferen¬ 
cia entre las marcas 1, 3 y 4 pero cada marca del primer gru¬ 
po parece diferir de manera importante respecto de todas las 
marcas del segundo grupo. 

13. 3 1 4 2 5 

427.5 462.0 469.3 502.8 532.1 


15. w = 5.94 2 1 3 4 

24.69 26.08 29.95 33.84 

Las únicas diferencias importantes están entre 4 y 1 y 2. 

17. (-0.029, 0.379) 


19. Funcionará cualquier valor de la suma de cuadrados de error 
(SCE) entre 422.16 y 431.88. 

21. a. f = 22.6 y F„ ni , 7S ~ 3.3, de modo que rechace H n . 
b. (-99.16,-35.64H29.34, 94.16) 

23. 1 2 3 4 

1 1 2.88 ± 5.81 7.43 ± 5.81 12.78 ± 5.48 

2 - - 4.55 ± 6.13 9.90 ± 5.81 

3 - - - 5.35 ± 5.81 

4 — — 

4 3 2 1 


25. a. Normal, varianzas iguales 

b. SCTr = 8.33, SCE = 77.79,/ = 1.7, H 0 no debe ser re¬ 
chazada (valor P > 0.10) 

27. a. /= 3.75 £ 3.10 = F 00532 o. así que las marcas parecen 
diferir. 

b. La normalidad es bastante plausible (una gráfica de pro¬ 
babilidad normal de los residuos x¡j — x¡. muestra un patrón 
lineal). 

c. 4 3 2 1 Sólo las marcas 1 y 4 parecen diferir de 

manera importante. 

31. Aproximadamente 0.62 
33. are sen (Vx/ñ) 

35. a. 3.68 < 4.94, así que H 0 no es rechazada, 
b. 0.029 > 0.01, y otra vez H 0 no es rechazada. 

37. /= 8.44 > 6.49 = F 0001 , el valor P < 0.001 y Fl 0 debe ser 
rechazada. 

5 3 1 4 2 Este patrón de subrayar es un poco difícil 

de interpretar. 
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39. El intervalo de confianza es (—0.144, 0.474), que no 
incluye 0. 

41. /= 3.96 < 4.07, así que H 0 : cr A = 0 no puede ser rechazada. 


43. (-3.70, 1.04), (-4.83, -0.33), (-3.77, 1.27), (-3.99, 0.15). 
Sólo p, 1 — ju, 3 entre estos cuatro contrastes parece diferir de 
modo importante de cero. 

45. Son idénticos. 


Capítulo 11 


1. a. f A = 1.55, así que no rechace H 0A . 

b. f B — 2.98, así que no rechace H 0B . 

a - Ía ~ 12.987 a T^Qoij.g, así que concluya que hay un efec¬ 
to de caudal de gas; f B = 105.31, así que concluya que hay 
un efecto de caudal de líquido. b. w = 95.44; 231.75 
325.25 441.0 613.25, y sólo los dos caudales más bajos no 
difieren de modo importante entre sí. 

c. 336.75 382.25 419.25 473 y sólo los caudales más bajo 
y más alto parecen diferir de modo importante entre sí. 


5. f A = 2.56, F 0013 12 = 5.95 y parece no haber efecto debido 
al ángulo de tiro. 


Fuente 

gl 

SC 

MC 

/ 

Tratamientos 

2 

28.78 

14.39 

1.04 

Bloques 

17 

2977.67 

175.16 

12.68 

Error 

34 

469.55 

13.81 


Total 

53 

3476.00 




La calificación promedio real de adaptación al parecer no 
depende del tratamiento. b. Sí',f B es bastante grande, lo 
que indica gran variabilidad entre sujetos. 


Fuente 

gl 

SC 

MC 

/ 

74.05 

Tratamientos 

3 

81.19 

27.06 

22.4 

3.01 

Bloques 

8 

66.50 

8.31 



Error 

24 

29.06 

1.21 



Total 

35 

176.75 




1 

4 


3 

2 


8.56 

9.22 

10.78 

12.44 


Los residuos 

son 

0.0350, 

0.0117, - 

-0.0750, 

0.0283, 


0.0875, -0.0758, -0.0825, 0.0708, -0.1225, 0.0642, 

0.1575, y —0.0992. El patrón de la gráfica de probabilidad 
normal es bastante lineal. 

13. b. Cada SC se multiplica por c 2 , pero f A y/ s no cambian. 
15. a. Aproximadamente 0.20, 0.43 b. Aproximadamente 
0.30 


17. a. f A = 3.76, f B = 6.82,/^ = 0.74, y F 00529 = 4.26, así que 
la cantidad de adición de fibra de carbono parece importante, 
b. f A = 6.54,4 = 5.33, f AB = 0.27 


Fuente 

gl 

SC 

MC 

/ 

Carbón 

2 

1.00241 

0.50121 

29.49 

NaOH 

2 

0.12431 

0.06216 

3.66 

Interacción 

4 

0.01456 

0.00364 

0.21 

Error 

9 

0.15295 

0.01699 


Total 

17 

1.29423 




El tipo de carbón no parece afectar la acidez total. 


b. Los carbones 1 y 3 no difieren entre sí de modo importante, 
pero ambos difieren significativamente del carbón 2. 


21. a, b. Fuente gl SC MC / 


A 


2 22941.80 11470.90 

22.98 

B 


4 22765.53 

5691.38 

5.60 

AB 


8 3993.87 

499.23 

0.49 

Error 

15 15253.50 

1016.90 


Total 

29 64954.70 



h oa 

Y 77 qb 

son rechazadas ambas. 



Fuente 

gl 

SC 

MC 

/ 


A 

2 

11,573.38 5786.69 

MCA 

26.70 

MCAB 

B 

4 

17,930.09 4482.52 

MCB 

MCE 

28.51 

AB 

8 

1734.17 

216.77 

MCAB 

= 1.38 

CME 

Error 

30 

4716.67 

157.22 



Total 

44 

35,954.31 




Como F 001 8 30 

= 3.17, F 0 01 , 2.8 

= 8.65, 

y ^0.01,4.30 

= 4.02, 

H og no es rechazada pero H aA and H 0B son rechazados. 

(-1.39, - 

-1.05) 





a. Fuente 

gl 

SC 

MC 

/ 

^0.05 

A 

2 

14,144.44 

7,072.22 

61.06 

3.35 

B 

2 

5,511.27 

2,755.64 

23.79 

3.35 

C 

2 

244,696.39 122,348.20 

1,056.27 

3.35 

AB 

4 

1,069.62 

267.41 

2.31 

2.73 

AC 

4 

62.67 

15.67 

0.14 

2.73 

BC 

4 

331.67 

82.92 

0.72 

2.73 

ABC 

8 

1,080.77 

135.10 

1.17 

2.31 

Error 

27 

3,127.50 

115.83 



Total 

53 

270,024.33 




d. 2o 05 3 27 = 3.51, w = 8.90, y los tres niveles difieren en- 

tre sí de manera importante. 




Fuente 

gl 

SC 

MC 

/ 

A 

2 

12.896 


6.448 

1.04 

B 

1 

100.041 

100.041 

16.10 

C 

3 

393.416 

131.139 

21.10 

AB 

2 

1.646 


0.823 

<1 

AC 

6 

71.021 

11.837 

1.905 

BC 

3 

1.542 


0.514 

<1 

ABC 

6 

9.771 


1.629 

<1 

Error 

72 

447.500 


6.215 


Total 

95 

1037.833 
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a. No hay efectos de interacción importantes. 

b. Los principales efectos del factor B y el factor C son im¬ 
portantes. 

c. w = 1.89; sólo las máquinas 2 y 4 no difieren de modo 
importante entre sí. 

31. La columna de valor P muestra que varios efectos de interac¬ 
ción son importantes al nivel 0.01. 


33. Fuente 

gl 

SC MC 

/ 

A 

6 

67.32 11.02 


B 

6 

51.06 8.51 


C 

6 

5.43 0.91 

0.61 

Error 

30 

44.26 1.48 


Total 

48 

168.07 


^0.05,6.30 2.42, f c 

0.61, así que H oc no es rechazada. 

35. Fuente 

gl 

SC MC 

/ 

A 

4 

28.88 7.22 

10.7 

B 

4 

23.70 5.93 

8.79 

C 

4 

0.62 0.155 

<1 

Error 

12 

8.10 0.675 


Total 

24 

61.30 


Como F 005412 = 3.26, Ay B son importantes. 


37. Fuente 

gl 

MC 

/ 

A 

2 

2207.329 

2259* 

B 

1 

47.255 

48.4* 

C 

2 

491.783 

503* 

D 

1 

0.044 

<1 

AB 

2 

15.303 

15.7* 

AC 

4 

275.446 

282* 

AD 

2 

0.470 

<1 

BC 

2 

2.141 

2.19 

BD 

1 

0.273 

<1 

CD 

2 

0.247 

<1 

ABC 

4 

3.714 

3.80 

ABD 

2 

4.072 

4.17* 

ACD 

4 

0.767 

<1 

BCD 

2 

0.280 

<1 

ABCD 

4 

0.347 

<1 

Error 

36 

0.977 


Total 

71 

93.621 



* Denota una razón F importante. 


39. a. j3j = 54.38, yff = -2.21, y 

b. Efecto 

Fuente Contraste 

áf = 2.21. 

MC 

/ 

A 

1307 

71,177.04 

436.7 

B 

1305 

70,959.34 

435.4 

C 

529 

11,660.04 

71.54 

AB 

199 

1,650.04 

10.12 

AC 

-53 

117.04 

<1 

BC 

57 

135.38 

<1 

ABC 

27 

30.38 

<1 

Error 


162.98 



Fuente 


SC 

/ 

A 


136,640.02 

1,007.6 

B 


139,644.19 

1,029.8 

C 


24,616.02 

181.5 

D 


20,377.52 

150.3 

AB 


2,173.52 

16.0 

AC 


2.52 

<1 

AD 


58.52 

<1 

BC 


165.02 

1.2 

BD 


9.19 

<1 

CD 


17.52 

<1 

ABC 


42.19 

<1 

ABD 


117.19 

<1 

ACD 


188.02 

1.4 

BCD 


13.02 

<1 

ABCD 


204.19 

1.5 

Error 


4339.33 


Total 


328,607.98 


^0.05,1.32 

~ 4.15, de modo que sólo los cuatro efectos princi- 

pales y la interacción AB parecen importantes. 


Fuente 

gl 

SC 

/ 

A 

1 

0.436 

<1 

B 

1 

0.099 

<1 

C 

1 

0.109 

<1 

D 

1 

414.12 

851 

AB 

1 

0.003 

<1 

AC 

1 

0.078 

<1 

AD 

1 

0.017 

<1 

BC 

1 

1.404 

3.62 

BD 

1 

0.456 

<1 

CD 

1 

2.190 

4.50 

Error 

5 

2.434 


^0.05,1,5 ' 

= 6.61, de modo que sólo el efecto principal del fac- 

tor D se 

considera importante. 


a. 1; (1), ab, cd, abed; 2: a, b, acd, bed; 3: 

c, d, abe, 

abd; 4: 

ac, be, ad, bd. 



b. Fuente gl 

SC 

f 


A 

1 

14,028.13 

53.89 

B 

1 

92,235.13 

345.33 

C 

1 

3.13 

<1 

D 

1 

18.00 

<1 

AC 

1 

105.13 

<1 

AD 

1 

200.00 

<1 

BC 

1 

91.13 

<1 

BD 

1 

420.50 

1.62 

ABC 

1 

276.13 

1.06 

ABD 

1 

2.00 

<1 

ACD 

1 

450.00 

1.73 

BCD 

1 

2.00 

<1 

Bloques 

7 

898.88 

<1 

Error 

12 

3,123.72 


Total 

31 

111,853.88 



F ü oí 1 12 — 9.33, así que sólo los principales efectos de A y B 
son importantes. 
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47. a. ABFG; (1), ab, cd, ce, de, fg, acf, adf, adg, aef, acg, aeg, 
bcg, bcf bdfi bdg, bef beg, abcd, abce, abde, abfg, cdfg, cefg, 
defg, acdefi acdeg, bcdef, bcdeg, abcdfg, abcefg, abdefg. [A, 
BCDE, ACDEFG, BFG }, [B, ACDE, BCDEFG, AFG}, {C, 
ABDE, DEFG, ABCFG j, {D, ABCE, CEFG, ABDFG }, {E, 
ABCD, CDFG, ABEFG }, {F, ABCDEF, CDEG, ABG }, {G, 
ABCDEG, CDEF, ABF}. b. 1: (1), aef, beg, abcd, abfg, 
cdfg, acdeg, bcdef; 2: ab, cd,fg, aeg, bef, acdef, bcdeg, abcd¬ 
fg; 3: de, acg, adf, bcf, bdg, abce, cefg, abdefg; 4: ce, acf, adg, 
bcg, bdf abde, defg, abcefg. 

49. SCA = 2.250, SCB = 7.840, SCC = 0.360, SCD = 52.563, 
SCE = 10.240, SCAB = 1.563, SCAC = 7.563, SCAD = 
0.090, SCAE = 4.203, SCBC = 2.103, SCBD = 0.010, 
SCBE = 0.123, SCCD = 0.010, SCCE = 0.063, SCDE = 
4.840. Error SC = suma de las SC de dos factores = 20.568, 
Error MC = 2.057, F 001 [ 10 = 10.04, así que sólo el efecto 
principal de D es importante. 


51. Fuente 


gL SC 

MC 

/ 

Efectos principales de A 1 322.667 

322.667 

980.38 

Efectos principales de B 3 35.623 

11.874 

36.08 

Interacción 


3 8.557 

2.852 

8.67 

Error 


16 5.266 

0.329 


Total 


23 372.113 



F 0 0 5 3 i6 = 3.24, por lo que parecen estar presentes interac- 

ciones. 





53. Fuente 

gl 

SC 

MC 

/ 

A 

1 

30.25 

30.25 

6.72 

B 

1 

144.00 

144.00 

32.00 

C 

1 

12.25 

12.25 

2.72 

AB 

1 

1,122.25 

1,122.25 

249.39 

AC 

1 

LOO 

LOO 

0.22 

BC 

1 

12.25 

12.25 

2.72 

ABC 

1 

16.00 

16.00 

3.56 

Error 

4 

36.00 

4.50 


Total 

7 





Sólo el efecto principal para B y el efecto de interacción AB 
son importantes en a = 0.01. 


55. a. áj = 9.00, /3 x = 2.25, 5[ = 17.00, y l = 21.00, 

(a0) u = 0, (aS) n = 2.00, (ay) n = 2.75, (/38) n = 0.75, 
(Py)n = 0.50, (SV)n = 4.50 

b. Una gráfica de probabilidad normal sugiere que los efec¬ 
tos principales A, Cy D son bastante importantes, y quizá la 
interacción CD. De hecho, agrupando las 4 SC de interac¬ 
ción de tres factores y la SC de interacción de cuatro facto¬ 
res, para obtener una SCE basada en 5 grados de libertad, y 
luego construyendo una tabla ANOVA sugiere que éstos son 
los efectos más importantes. 


Fuente 

gl 

SC 

MC 

/ 

P 

A 

2 

34,436 

17,218 

436.92 

0.000 

B 

2 

105,793 

52,897 

1342.30 

0.000 

C 

2 

516,398 

258,199 

6552.04 

0.000 

AB 

4 

6,868 

1,717 

43.57 

0.000 

AC 

4 

10,922 

2,731 

69.29 

0.000 

BC 

4 

10,178 

2,545 

64.57 

0.000 

ABC 

8 

6,713 

839 

21.30 

0.000 

Error 

27 

1,064 

39 



Total 

53 

692,372 





Todos los efectos son significativos. 

59. Con base en los valores P de la tabla ANOVA, los factores 
estadísticamente significativos al nivel a = 0.01 son el tipo 
de adhesivo y el tiempo de cura. El material del conductor no 
tiene un efecto estadísticamente significativo en la resisten¬ 
cia a la adherencia. No hay más interacciones significativas. 


Fuente 

gl 

SC 

MC 

/ 

A 

4 

285.76 

71.44 

0.594 

B 

4 

227.76 

56.94 

0.473 

C 

4 

2867.76 

716.94 

5.958 

D 

4 

5536.56 

1384.14 

11.502 

Error 

8 

962.72 

120.34 

^0.05,4.8 = 3' 


Total 24 


H aA y H ob no pueden ser rechazadas, mientras que H oc y H 0D 
son rechazadas. 


Capítulo 12 


1. a. Las tablas siguientes están basadas en la repetición, cinco 
veces, de cada uno de los valores de tallo (una vez para las 
hojas 0 y 1, una segunda vez para las hojas 2 y 3, etcétera). 


17 

0 




17 

2 

3 



17 

4 

4 

5 


17 

6 

7 



17 





18 

0 

0 

0 

0 0 11 

18 

2 

2 

2 

2 

18 

4 

4 

5 


18 

6 




18 

8 





tallo: centenas y decenas 
hoja: unidades 


No hay valores aislados, ni brechas significativas, y la distri¬ 
bución casi tiene forma de campana con un grado razonable¬ 
mente alto de concentración alrededor de su centro, en 
aproximadamente 180. 


0 

1 

1 

1 

1 

1 

2 

2 

2 

2 

2 

3 


8 8 9 
0 0 0 0 

3 

4 4 4 4 
6 6 

8 8 8 9 
1 1 

5 

6 

0 0 


tallo: unidades 
hoja: decenas 


Un valor típico es alrededor de 1.6, y hay una cantidad razo¬ 
nable de dispersión alrededor de este valor. La distribución 
es un tanto sesgada hacia valores grandes, los dos más gran¬ 
des de los cuales pueden ser candidatos para ser valores ais¬ 
lados. 
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b. No, porque las observaciones con valores x idénticos tienen 
valores y diferentes. 

c. No, porque los puntos no parecen caer en absoluto cerca de 
una recta o curva simple. 

3. Sí, sí. 

5. b. Sí. 

c. Parece haber una relación cuadrática aproximada (los 
puntos caen cerca de una parábola). 


7. a. 5050 b. 1.3 c. 130 d. -130 
9. a. 0.095 b. -0.475 c. 0.830, 1.305 

d. 0.4207, 0.3446 e. 0.0036 

11. a. -0.01, -0.10 b. 3.00,2.50 

c. 0.3627 d. 0.4641 


13. a. 
15. a. 


335566677889 

122356689 

1 

2 9 

9 

0 


Valor típico en los 40 bajos, cantidad razonable de variabili¬ 
dad, sesgo positivo, dos valores aislados potenciales. 

b. No 

c. y = 3.2925 + 0.10748.x = 7.59. No; riesgo de extrapolación 

d. 18.736, 71.605, 0.738, sí 


17. a. Estimamos que 0.144 es el cambio esperado en conteni¬ 
do de calcio asociado con un aumento de 1 mg/cm 1 2 3 en la 
cantidad de material disuelto. Alrededor del 86% de la va¬ 
riación observada en contenido de calcio puede atribuirse a 
la relación de modelo de regresión lineal sencilla, entre con¬ 
tenido y la cantidad de material disuelto. 

b. 10.88 c. 1.46 

19. a. y = -45.5519 + 1.7114.x b. 339.51 

c. -85.57 d. Las y¡ son 125.6, 168.4, 168.4, 211.1, 
211.1, 296.7, 296.7, 382.3, 382.3, 467.9, 467.9, 553.4, 
639.0, 639.0; una recta de 45° que pasa por (0, 0). 

21. a. Sí; r 2 = 0.985 b. 368.89 c. 368.89 
23. a. 16,213.64; 16,205.45 

b. 414,235.71; sí, porque r 2 = 0.961. 

27. /3, = Ex^/Exf 

29. Conjunto 

de datos r 2 v Más eficaz: conjunto 3 

1 0.43 4.03 Menos eficaz: conjunto 1 

2 0.99 4.03 

3 0.99 1.90 

31. a. 0.001017 b. (-0.00956, -0.00516) 

33. a. (0.081,0.133) 

b. /7 a : j8j > 0.1, valor P = 0.277, no 
35. a. (0.63, 2.44) es un intervalo de confianza de 95%. 

b. Sí. t = 3.6, valor P = 0.004 

c. No; extrapolación 

d. (0.54, 2.82), no 
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37. a. Sí. t = 7.99, valor P ~ 0. Nota: Hay un valor aislado mo¬ 
derado, de modo que la gráfica de probabilidad normal re¬ 
sultante no es del todo satisfactoria. 

b. Sí. t = — 5.8, valor P ~ 0, rechace H 0 :fi 1 = 1 a favor de 

P, < 1 

39. /= 71.97, = 0.004837, t = 8.48, valor P = 0.000 

43. d = 1.20, grado de libertad = 13, y j3 ~ 0.1. 

45. a. (77.80,78.38) 

b. (76.90, 79.28), mismo centro pero más ancho 

c. más ancho, porque 115 está más lejos que x 

d. t = —11, valor P = 0 

47. a. 95% IP es (20.21, 43.69), no 

b. (28.53, 51.92), al menos 90% 

49. (431.3,628.5) 

51. a. 0.40 es más cercano a x = 0.7495 b. (0.745, 0.875) 

c. (0.059,0.523) 

53. a) más angosto que b), c) más angosto que d), a) más an¬ 
gosto que c), b) más angosto que d) 

57. Si, por ejemplo, 18 es la edad mínima de elegibilidad, enton¬ 
ces para casi todos y ~ x — 18. 

59. a. 0.966 

b. El porcentaje en peso de fibra seca para el primer espé¬ 
cimen tiende a ser más grande que para el segundo. 

c. Sin cambio d. 93.3% 

e. t = 14.9, valor P ~ 0, de modo que parece haber esa re¬ 
lación. 

61. a. r = 0.0748, t — 3.9, valor P = 0.001. Usando ya sea 
a = 0.05 o 0.01, sí. 
b. 0.560 (56%), igual 

63. r = 0.773, pero t = 2.44 < 2.776; así que H 0 : p = 0 no pue¬ 
de ser rechazada. 

65. a. La gráfica x es un poco curvada pero no tan preocupante 
en el marco del pequeño tamaño muestral. La gráfica y es 
bastante recta. 

b. t = 6.3 £ 3.355, y parece haber una relación lineal. 

67. a. Rechazar H 0 

b. No. valor P = 0.00032 => z ~ 3.6 => r ~ 0.16, que in¬ 
dica sólo una relación débil. 

c. Sí, pero muy grande n => p <=> 0.022, y no hay significa¬ 
ción práctica. 

69. a. 95% IC: (0.888, 1.086) 

b. 0.95% IC: (47.730, 49.172) 

c. 95% IP: (45.378, 51.524) 

d. Más angosto para x = 25, es más cercano a x 

e. 0.981 

71. a. t = —1.24 > —2.201, y no rechace H 0 
b. 0.970 

73. a. 0.507 b. 0.712 c. valor P = 0.0013 < 0.01 = 
a, y rechace H 0 : j3¡ = 0 y concluya que hay una relación 
lineal útil. d. Un IC de 95% es (1.056, 1.275). 

e. 1.0143,0.2143 
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75. a. y = 14.1904 — 0.14892* b . t— —1.43, así que no 

rechace H 0 : j8¡ = —0.10. c. No; Z(x — x) 2 = 143 aquí 
y 182 para la información dada. d. Un intervalo de con¬ 
fianza de 95% para /u, y . 28 es (9.599, 10.443). 

77. a. Una relación lineal importante 

b. y = -0.08259 + 0.044649* 


c. 98.3% 

d. 0.7702, -0.0902 e. Sí; t = 19.96 
f. (0.0394, 0.0499) g. (0.762, 0.858) 

81. b. 0.573 

87. t = —1.14, y es plausible que j8¡ — y¡. 


Capítulo 13 


1. a. 6.32, 8.37, 8.94, 8.37 y 6.32 b. 7.87, 8.49, 8.83, 
8.94 y 2.83 c. Es probable que la desviación sea mucho 
menor para los valores * de la parte b). 

3. a. Sí. b. -0.31, -0.31, 0.48, 1.23, -1.15, 0.35, 
-0.10, -1.39, 0.82, -0.16, 0.62, 0.09, 1.17, -1.50, 0.96, 
0.02, 0.65, —2.16, —0.79, 1.74. Aquí e/e* varía entre 0.57 y 
0.65, así que e* es cercano a e/s. c. No. 

5. a. Alrededor de 98% de variación observada en grosor está 
explicada por la relación. 

b. Una relación no lineal. 

7. a. No. b. Las e¡ son-16.60, 9.70, 19.00,-0.70, 
11.40; las e¡* son-1.55, 0.68,1.25,-0.05,-1.06; una 
función cuadrática. 

9. Para el conjunto 1, la regresión lineal simple es apropiada. 
Una regresión cuadrática es razonable para el conjunto 2. En 
el conjunto 3 (13, 12.74) parece muy inconsistente con la in¬ 
formación restante. La pendiente estimada para el conjunto 
4 depende principalmente de la observación simple (19, 12.5), y 
la evidencia para una relación lineal no es obligatoria. 

11. c. V{Y¡) aumenta y V(Y¡ — Y¡) disminuye. 

13. t con n — 2 grados de libertad; 0.02 

15. a. Un patrón curvo b. Un patrón lineal 

c. Y=ax^-e d. Un IP de 95% es (3.06, 6.50). 

e. Un residuo estandarizado, correspondiente a la tercera 
observación, es un poco grande. Sólo hay dos residuos es¬ 
tandarizados, pero otros dos son 0 en esencia. Los patrones 
de una gráfica de residuo estandarizado y una gráfica de pro¬ 
babilidad normal son marginalmente aceptables. 

17. a. E*¡ = 15.501, Ey¡ = 13.352, Z{x'¡) 2 = 20.228, 

Zx'í/í = 18.109, Z(y'¡) 2 = 16.572, 0 l = 1.254, j3 0 = 
—0.468, a = 0.626, ¡3 = 1.254 c . t — —1.07, y no recha¬ 
ce H 0 . d. H 0 : fi = 1, t = —4.30, así que rechace H 0 . 

19. a. No b. Y’ = j3 0 + • (1/í) + e', donde Y' = ln(F), 

y entonces Y = ae^' • e. c. /3 = /3, = 3735.45, /3 0 = 
-10.2045, á = (3.70034) • (10“ 5 ), y' = 6.7748, y = 875.5 

d. SCE = 1.39587, SCPE = 1.36594 (usando valores trans¬ 
formados),/= 0.33 < 8.68 = F 001 ¡ 15 , y no rechace H 0 . 

21. a. f¡i Y . x = 18.14 - 1485/x b. y = 15.17 
23. Para un modelo exponencial. V(ljx) = a 2 e 2 ^ JI cr 2 , que depen¬ 
de de x. Un resultado similar se cumple para el modelo de 
potencia. 

25. a. La estimación puntual de f}¡ es /3¡ = 0.1772, y la propor¬ 
ción estimada de probabilidades es 1.194. H 0 : f3 l = 0 es re¬ 


chazada a favor de la conclusión de que la experiencia no 
parece afectar la probabilidad de una operación exitosa del 
trabajo. 

27. b. 52.88,0.12 c. 0.895 d. No 

e. (48.54, 57.22) f. (42.85, 62.91) 

29. a. SCE = 16.8, s = 2.048 b. R 2 = 0.995 c. Sí. t = 
- 6.55, valor P = 0.003 (de MINITAB) d. 98% de nive¬ 
les de confianza individuales => nivel de confianza conjunta a 
96% : (0.671, 3.706), (-0.00498, -0.00135) e. (69.531, 
76.186), (66.271, 79.446), usando software. 

31. a. 13.636 + 11.406* - 1.7155* 2 

b. Sí. Sí, (6, 20) c. 2.040,0.947. La prueba F de utilidad 
del modelo vía el MINITAB da/= 35.9, valor P — 0.003, su¬ 
giriendo un modelo útil. d. Sí, sí e. (28.35, 35.28) 

33. a. 0.9671,0.9407 

b. 0.0000492* 3 - 0.000446058* 2 + 0.007290688* + 
0.96034944 c. t = 2 < 3.182 = t Q025i , de modo que el 
término cúbico debe eliminarse. d. Idénticos 

e. 0.987, 0.994, sí 

35. y = lMS3e o m9x -° M22x ‘ 

37. a. 4.9 b. Cuando el número de entregas se mantiene fi¬ 
jo, el promedio de cambio en tiempo de viaje asociado con 
un aumento de 1 milla en distancia recorrida es 0.060 horas. 
Cuando la distancia recorrida se mantiene fija, el promedio 
de cambio en tiempo de viaje asociado con una entrega ex¬ 
tra es 0.900 horas. c. 0.9861 

39. a. 77.3 b. 40.4 

41. /= 24.4 > 5.12 = Fq ooi 6 30’ Y e l va l° r P << 0.001. El mo¬ 
delo escogido parece ser útil. 

43. a. 48.31,3.69 b. No. Si *[ aumenta, debe cambiar ya 
sea * 3 o x 2 . c. Sí, porque/= 18.924, valor P = 0.001. 

d. Sí, usando a = 0.01, porque t = 3.496 y valor P = 0.003. 

45. a. / = 87.6, valor P = 0, parece ser una relación lineal entre 
V y al menos uno de los pronosticadores. b. 0.935 

c. (9.095, 11.087) 

47. b. Valor P = 0.000, así que concluya que el modelo es útil. 

c. Valor P = 0.034 < 0.05 = a, y rechace H 0 \ j3 3 = 0; % 
de basura parece dar información adicional útil. 

d. (1479.8, 1531.1), precisión razonable e. Un IP de 
95% es (1435.7, 1575.2). 
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49. a. 96.8303, -5.8303 b. / = 14.9 > 8.02 = F 005 2 g , 
rechace H 0 y concluya que el modelo es útil. c. (78.28, 
115.38) d. (38.50, 155.16) e. (46.91, 140.66) f. No. 
Valor P = 0.208, así H 0 : fi l = 0 no puede ser rechazada. 

51. a. No b./= 5.04 S 3.69 = F 0 05 5 8 . Parece haber una 
relación lineal útil. c. 6.16, 3.304, (16.67, 31.91) 
d. f— 3.44 < 4.07 = 7*0.05,3.8’ as í H 0 : /3 3 = /3 4 = /3 5 = 0 no 
puede ser rechazada. Los términos cuadráticos pueden borrarse. 

55. a. La variable dependiente es ln(<?), y los predictores son 
x¡ = ln(a) y jc 2 = ln(b); j8 = = 0.9450, y = 0 2 = 

0.1815, a = 4.7836, q = 18.27. 

b. Ahora la regresión de ln(g) en función de x 1 = a y x 2 = b. 

c. (1.24, 5.78) 


k 

R 2 

adj. R 1 

c k 

1 

0.676 

0.647 

138.2 

2 

0.979 

0.975 

2.7 

3 

0.9819 

0.976 

3.2 

4 

0.9824 


4 

a. 

El modelo 

con k = 2 

b. No 


59. El modelo con pronosticadores jq, jc 3 y x 5 

61. No. Todos los valores de R 2 son mucho menores que 0.9. 

63. El impacto de estas dos observaciones debe investigarse más 
a fondo. No enteramente. La eliminación de la observación 
#6 seguida de no regresión también debe considerarse. 

65. a. Las dos distribuciones tienen cantidades similares de va¬ 
riabilidad, son razonablemente simétricas y no contienen 
valores aislados. La diferencia principal es que la mediana 
de los valores de primer orden es de unos 840, en tanto que 
es de alrededor de 480 para valores no de primer orden. Un 
intervalo de confianza t de 95% para la diferencia entre me¬ 
dias es (132, 557). 

b. r 2 = 0.577 para el modelo de regresión lineal simple, va¬ 
lor P para utilidad de modelo = 0, pero un residuo estanda¬ 
rizado es —4.11. Incluir un indicador para primer orden y no 
de primer orden no mejora el ajuste, como tampoco incluir 
un indicador y pronosticador de interacción. 

67. a. Cuando el género, peso y ritmo cardiaco se mantienen fi¬ 
jos, estimamos que el promedio de cambio en V0 2 máx aso¬ 
ciado con un aumento de 1 minuto en tiempo de caminata es 
— 0.0996. b. Cuando el peso, tiempo de caminata y rit- 
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mo cardiaco se mantienen fijos, la estimación del promedio 
de diferencia entre VO, máx para hombres y mujeres es 
0.6566. c. 3.669, -0.519 d. 0.706 
e. /= 9.0 a 4.89 = F 001415 , de manera que parece ser una 
relación útil. 

69. a. No. Hay curvatura suficiente en el diagrama de dispersión, 
b. La regresión cúbica da R 2 = 0.998 y un intervalo de pre¬ 
dicción de 95% de (261.98, 295.62), y el pronosticador cú¬ 
bico parece ser importante (valor P = 0.001). Una regresión 
de y contra ln(x) tiene r 2 = 0.991, pero hay un residuo estan¬ 
darizado muy grande y el diagrama residual estandarizado 
no es satisfactorio. 

71. a. R 2 = 0.802,/= 21.03, valor F = 0.000. El pH es un can¬ 
didato para eliminación. Nótese que hay un residuo estanda¬ 
rizado extremadamente grande. 

b. R 2 = 0.920, R 2 ajustada = 0.774, / = 6.29, valor P = 
0.002 

c. /= 1.08, valor P > 0.10, no rechazar H 0 : //,= ••• = ¡3 20 
= 0. El grupo de predictores de segundo orden no parece ser 
útil. 

d. R 2 = 0.871,/ = 28.50, valor P = 0.000, y ahora los seis 
predictores son considerados importantes (el máximo valor 
P para cualquier relación t es 0.016); la importancia de pH 2 
fue ocultada en la prueba de c). Nótese que hay dos residuos 
estandarizados más bien grandes. 

73. a. /= 1783, de modo que el modelo parece ser útil. 

b. / = —48.1 £ —6.689, por lo que incluso al nivel 0.001 
el predictor cuadrático debe retenerse. 

c. No d. (21.07,21.65) e. (20.67,22.05) 

75. a. /= 30.8 S 9.55 = F 001 27 , y el modelo parece ser útil. 

b. t — —7.69 y valor P < 0.001, y retenga el predictor cua¬ 
drático. c. (44.01,47.91) 

77. a. 231.75 b. 0.903 c./= 41.9, que indica una re¬ 
lación útil. d. (220.9, 238.1) 

79. Hay varias opciones razonables en cada caso. 

81. a. /= 106, valor P » 0 b. (0.014, 0.068) 

c. t — 5.9, rechazar H 0 : j8 4 = 0, el porcentaje de no blancos 
parece ser importante. d. 99.514, y — y = 3.486 


Capítulo 14 


1. a. Rechazar H 0 . b. No rechazar H 0 . 
c. No rechazar H 0 . d. No rechazar H 0 . 

3. No. x 2 ~ 1-57 y valor P > 0.10, y H 0 no puede ser rechazada. 

5. x 2 ~ 6.61 < 14.684 = X 2 a 109 ’ Y no rechazar H 0 . 

7. x 2 ~ 4-03 y valor P > 0.10, y no rechazar H a . 

9. a. [0, 0.2231), [0.2231, 0.5108), [0.5108, 0.9163), [0.9163, 

1.6094) y [1.6094, oo) b. x 2 ~ 1-25 < x^ 4 para cualquier a 
razonable, de modo que la distribución exponencial especifica- 15. 
da es bastante plausible. 


11. a. (-«., -0.97), [-0.97, -0.43), [-0.43, 0), [0, 0.43), 
[0.43, 0.97), y [0.97, oo) b. (-oo, 0.49806), [0.49806, 
0.49914), [0.49914, 0.5), [0.5, 0.50086), [0.50086, 
0.50194), y [0.50194, oo) c . * 2 = 5.53, x 2 0 105 = 9.236, 
y el valor P > 0.10 y la distribución normal especificada es 
plausible. 

p = 0.0843, x 2 ~ 280.3 > x 2 a , para cualquier a tabulada, y 
el modelo da un mal ajuste. 

La probabilidad es proporcional a 0 233 (1 — 0) 367 , de donde 
8 = 0.3883. Las cantidades esperadas estimadas son 21.00, 
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53.33, 50.78, 21.50 y 3.41. Combinando las celdas 4 y 5, 
X 2 = 1.62, y no rechace H 0 . 

17. Á = 3.167, de la cual y 2 = 103.98 » Y 2 , , = Y 2 para 
cualquier a , tabulada, y la distribución Poisson da un muy 
mal ajuste. 

19. 0! = (2/i, + n 3 + n s )/2n = 0.4275, Ó 2 = 0.2750, * 2 = 
29.1, x 2 oí 3 = 11.344, y rechace H 0 . 

21. Sí. La hipótesis nula de una distribución poblacional normal 
no se puede rechazar. 

23. MINITAB da r = 0.967, y como c 010 = 0.9707 y c 005 = 
0.9639,0.05 < valor P < 0.10. Usando o: = 0.05, la norma¬ 
lidad se considera plausible. 

25. x 2 ~ 23.18 £ 13.277 = X 2 00í4 > así H 0 es rechazada. Las 
proporciones parecen ser diferentes. 

27. Sí. x 2 = 44.98 y valor P < 0.001. 

29. p¡j = proporción de la y'-ésima combinación de sexo que re¬ 
sulta del í-ésimo genotipo, x 2 ~ 6.46, y el valor P > 0.10 y 
la hipótesis nula de homogeneidad no se puede rechazar. 


31. Sí. x 2 — 14.15, y 0.025 < valor P < 0.03 y H 0 debe ser re¬ 
chazada al nivel de significación 0.05. 

35. Nyjn, nflyjn, 24 

37. x 2 ~ 3.65 < 5.992 ~ X^ 052 Y Ho no se puede rechazar. 

39. Sí. x 2 = 131 y el valor P < 0.001. 

41. x 2 ~ 22.4 y el valor P < 0.001, y se rechaza la hipótesis nu¬ 
la de independencia. 

43. Valor P = 0, y se rechaza la hipótesis nula de homogeneidad. 

47. a. Valor estadístico de prueba = 19.2, valor P — 0 

b. Evidencia de una relación débil en el mejor de los casos; 
valor de estadístico de prueba = — 2.13 

c. Valor de estadístico de prueba = — 0.98, valor P > 0.10 

d. Valor de estadístico de prueba = 3.3, 0.01 < valor P < 
0.05 

49. a. No 

b. Intervalo de confianza 99%: (0.58, 1.56) 

c. Sí. x 2 = 19.18, valor P— 0 

d. No./= 1.35, valor P > 0.1 


Capítulo 15 


1. s + = 35 y 14 < 35 < 64 y H 0 no puede ser rechazada. 

3. s + = 18 £ 21 y H 0 es rechazada. 

5. Rechazar H 0 si t + S 64 o s + ^ 14. Como i + = 72, H a es re¬ 
chazada. 

7. ,s + = 442.5, z = 2.89 > 1.645 y rechace H 0 . 


d 

0 

2 

4 6 

8 10 

12 

14 

16 

18 

20 

P(d) 

1 

24 

3 

24 

1 4 

24 24 

2 2 

24 24 

2 

24 

4 

24 

1 

24 

3 

24 

1 

24 


11 . w = 37 y 29 <37 < 61, y H 0 no puede ser rechazada. 

13. z = 2.27 < 2.58, y H 0 no puede ser rechazada, valor P ~ 0.023 
15. w = 39 £ 41 así H 0 es rechazada. 

17. (v (5) , x (32) ) = (11.15, 23.80) 


19. (-13.0, -6.0) 

21. (d ¡A5) , d mi) ) = (16, 87) 

23. k = 14.06 a 6.251 y rechace H 0 . 

25. k = 9.23 > 5.992 y rechace H 0 . 

27. f r = 2.60 < 5.992 y no rechace H 0 . 

29. f r = 9.62 > 7.815 = * 2 . 053 y rechace H 0 . 

31. (-5.9, -3.8) 

33. a. 0.021 b. c = 14 da a = 0.058; y = 12, y H 0 no pue¬ 
de ser rechazada. 

35. w' = 26 < 27, y no rechace H 0 . 


Capítulo 16 


1. Todos los puntos de la gráfica caen entre los límites de control. 
3. 0.9802,0.9512,53 
5. a. 0.0301 b. 0.2236 c. 0.6808 
7. LCI = 12.20, LCS = 13.70. No. 

9. LCI = 94.91, LCS = 98.17. Parece haber un problema en el 
22avo. día. 

c. 384.62 (mayor), 6.30 (menor) 


13. LCI = 12.37, LCS = 13.53 

15. a. LCI = 0, LCS = 6.48 
b. LCI = 0.48, LCS = 6.60 

17. LCI = 0.045, LCS = 2.484. Sí, porque todos los puntos 
están dentro de los límites de control. 

19. a. LCI = 0.105, LCS = 0.357 
b. Sí, porque 0.39 > LCS. 


11 . a. 200 


b. 4.78 
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21. p > 3/53 

23. LCI = O, LCS = 10.1 

25. Cuando el área = 0.6, LCI = 0 y LCS = 14.6; cuando el 


área 

= 0/ 

8, LCI = 

0 y LCS = 13. 

.4; Cuando el área 

= 1.0, 

LCI 

= 0; 

y LCS = 

12.6. 






/: 

1 

2 

3 

4 

5 

6 

7 

8 

di- 

0 

0.001 

0.017 

0 

0 

0.010 

0 

0 

ei 

0 

0 

0 

0.038 

0 

0 

0 

0.054 

l: 

9 

10 

11 

12 

13 

14 

15 


di 

0 

0.024 

0.003 

0 

0 

0 

0.005 


e;. 

0 

0 

0 

0.015 

0 

0 

0 



No hay señales fuera de control. 

29. n = 5,h = 0.00626 

31. Las probabilidades hipergeométricas (calculadas en una 
calculadora HP21S) son 0.9919, 0.9317, 0.8182, 0.6775, 
0.5343, 0.4047, 0.2964, 0.2110, 0.1464 y 0.0994, mientras 
que las correspondientes probabilidades binomiales son 
0.9862, 0.9216, 0.8108, 0.6767, 0.5405, 0.4162, 0.3108, 
0.2260, 0.1605 y 0.1117. La aproximación es satisfactoria. 

33. 0.9206, 0.6767, 0.4198, 0.2321, 0.1183; el plan con n = 
100, c = 2 es preferible. 


Respuestas a ejercicios seleccionados de número impar 709 

35. 0.9981 0.5968 y 0.0688 

37. a. 0.010, 0.018, 0.024, 0.027, 0.027, 0.025, 0.022, 0.018, 
0.014, 0.011 b. 0.0477, 0.0274 c. 77.3, 202.1, 
418.6, 679.9, 945.1, 1188.8, 1393.6, 1559.3, 1686.1, 1781.6 

39. La tabla x basada en las desviaciones estándar muéstrales: 
LCI = 402.42, LCS = 442.20. La gráfica x basada en los 
rangos muéstrales: LCI = 402.36, LCS = 442.26. Gráfica 
S: LCI = 0.55, LCS = 30.37. Gráfica R: LCI = 0, LCS = 
82.75. 

41. Gráfica S: LCI = 0, LCS = 2.3020; como s 2l = 2.931 > 
LSC, el proceso parece estar fuera de control en este mo¬ 
mento. Como está identificada una causa asignable, recalcu¬ 
le límites después de la eliminación: para una gráfica S, 
LCI= 0 y LCS = 2.0529; para una gráfica i, LCI = 48.583 
y LCS = 51.707. Todos los puntos en ambas gráficas están 
entre los límites de control. 

43. x = 430.65, s = 24.2905; para una gráfica S, LCS = 62.43 
cuando n = 3 y LCS = 55.11 cuando n = 4; para una gráfi¬ 
ca x, LCI = 383.16 y LCS = 478.14 cuando n = 3, y 
LCI = 391.09 y LCS = 470.21 cuando n = 4. 
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Tabla A.3 Áreas de la Curva normal estándar 


3>(z) = P(Z < z) 


Función de densidad normal estándar 



O 7 


z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

-3.4 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0002 

-3.3 

0.0005 

0.0005 

0.0005 

0.0004 

0.0004 

0.0004 

0.0004 

0.0004 

0.0004 

0.0003 

-3.2 

0.0007 

0.0007 

0.0006 

0.0006 

0.0006 

0.0006 

0.0006 

0.0005 

0.0005 

0.0005 

-3.1 

0.0010 

0.0009 

0.0009 

0.0009 

0.0008 

0.0008 

0.0008 

0.0008 

0.0007 

0.0007 

-3.0 

0.0013 

0.0013 

0.0013 

0.0012 

0.0012 

0.0011 

0.0011 

0.0011 

0.0010 

0.0010 

-2.9 

0.0019 

0.0018 

0.0017 

0.0017 

0.0016 

0.0016 

0.0015 

0.0015 

0.0014 

0.0014 

-2.8 

0.0026 

0.0025 

0.0024 

0.0023 

0.0023 

0.0022 

0.0021 

0.0021 

0.0020 

0.0019 

-2.7 

0.0035 

0.0034 

0.0033 

0.0032 

0.0031 

0.0030 

0.0029 

0.0028 

0.0027 

0.0026 

-2.6 

0.0047 

0.0045 

0.0044 

0.0043 

0.0041 

0.0040 

0.0039 

0.0038 

0.0037 

0.0036 

-2.5 

0.0062 

0.0060 

0.0059 

0.0057 

0.0055 

0.0054 

0.0052 

0.0051 

0.0049 

0.0038 

-2.4 

0.0082 

0.0080 

0.0078 

0.0075 

0.0073 

0.0071 

0.0069 

0.0068 

0.0066 

0.0064 

-2.3 

0.0107 

0.0104 

0.0102 

0.0099 

0.0096 

0.0094 

0.0091 

0.0089 

0.0087 

0.0084 

-2.2 

0.0139 

0.0136 

0.0132 

0.0129 

0.0125 

0.0122 

0.0119 

0.0116 

0.0113 

0.0110 

-2.1 

0.0179 

0.0174 

0.0170 

0.0166 

0.0162 

0.0158 

0.0154 

0.0150 

0.0146 

0.0143 

-2.0 

0.0228 

0.0222 

0.0217 

0.0212 

0.0207 

0.0202 

0.0197 

0.0192 

0.0188 

0.0183 

-1.9 

0.0287 

0.0281 

0.0274 

0.0268 

0.0262 

0.0256 

0.0250 

0.0244 

0.0239 

0.0233 

-1.8 

0.0359 

0.0352 

0.0344 

0.0336 

0.0329 

0.0322 

0.0314 

0.0307 

0.0301 

0.0294 

-1.7 

0.0446 

0.0436 

0.0427 

0.0418 

0.0409 

0.0401 

0.0392 

0.0384 

0.0375 

0.0367 

-1.6 

0.0548 

0.0537 

0.0526 

0.0516 

0.0505 

0.0495 

0.0485 

0.0475 

0.0465 

0.0455 

-1.5 

0.0668 

0.0655 

0.0643 

0.0630 

0.0618 

0.0606 

0.0594 

0.0582 

0.0571 

0.0559 

-1.4 

0.0808 

0.0793 

0.0778 

0.0764 

0.0749 

0.0735 

0.0722 

0.0708 

0.0694 

0.0681 

-1.3 

0.0968 

0.0951 

0.0934 

0.0918 

0.0901 

0.0885 

0.0869 

0.0853 

0.0838 

0.0823 

-1.2 

0.1151 

0.1131 

0.1112 

0.1093 

0.1075 

0.1056 

0.1038 

0.1020 

0.1003 

0.0985 

-1.1 

0.1357 

0.1335 

0.1314 

0.1292 

0.1271 

0.1251 

0.1230 

0.1210 

0.1190 

0.1170 

-1.0 

0.1587 

0.1562 

0.1539 

0.1515 

0.1492 

0.1469 

0.1446 

0.1423 

0.1401 

0.1379 

-0.9 

0.1841 

0.1814 

0.1788 

0.1762 

0.1736 

0.1711 

0.1685 

0.1660 

0.1635 

0.1611 

-0.8 

0.2119 

0.2090 

0.2061 

0.2033 

0.2005 

0.1977 

0.1949 

0.1922 

0.1894 

0.1867 

-0.7 

0.2420 

0.2389 

0.2358 

0.2327 

0.2296 

0.2266 

0.2236 

0.2206 

0.2177 

0.2148 

-0.6 

0.2743 

0.2709 

0.2676 

0.2643 

0.2611 

0.2578 

0.2546 

0.2514 

0.2483 

0.2451 

-0.5 

0.3085 

0.3050 

0.3015 

0.2981 

0.2946 

0.2912 

0.2877 

0.2843 

0.2810 

0.2776 

-0.4 

0.3446 

0.3409 

0.3372 

0.3336 

0.3300 

0.3264 

0.3228 

0.3192 

0.3156 

0.3121 

-0.3 

0.3821 

0.3783 

0.3745 

0.3707 

0.3669 

0.3632 

0.3594 

0.3557 

0.3520 

0.3482 

-0.2 

0.4207 

0.4168 

0.4129 

0.4090 

0.4052 

0.4013 

0.3974 

0.3936 

0.3897 

0.3859 

-0.1 

0.4602 

0.4562 

0.4522 

0.4483 

0.4443 

0.4404 

0.4364 

0.4325 

0.4286 

0.4247 

- 0.0 

0.5000 

0.4960 

0.4920 

0.4880 

0.4840 

0.4801 

0.4761 

0.4721 

0.4681 

0.4641 


(continúa) 
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Tabla A.3 Áreas de la Curva normal estándar ( continuación) 


<í>(z) = P(Z < z) 


z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

0.0 

0.5000 

0.5040 

0.5080 

0.5120 

0.5160 

0.5199 

0.5239 

0.5279 

0.5319 

0.5359 

0.1 

0.5398 

0.5438 

0.5478 

0.5517 

0.5557 

0.5596 

0.5636 

0.5675 

0.5714 

0.5753 

0.2 

0.5793 

0.5832 

0.5871 

0.5910 

0.5948 

0.5987 

0.6026 

0.6064 

0.6103 

0.6141 

0.3 

0.6179 

0.6217 

0.6255 

0.6293 

0.6331 

0.6368 

0.6406 

0.6443 

0.6480 

0.6517 

0.4 

0.6554 

0.6591 

0.6628 

0.6664 

0.6700 

0.6736 

0.6772 

0.6808 

0.6844 

0.6879 

0.5 

0.6915 

0.6950 

0.6985 

0.7019 

0.7054 

0.7088 

0.7123 

0.7157 

0.7190 

0.7224 

0.6 

0.7257 

0.7291 

0.7324 

0.7357 

0.7389 

0.7422 

0.7454 

0.7486 

0.7517 

0.7549 

0.7 

0.7580 

0.7611 

0.7642 

0.7673 

0.7704 

0.7734 

0.7764 

0.7794 

0.7823 

0.7852 

0.8 

0.7881 

0.7910 

0.7939 

0.7967 

0.7995 

0.8023 

0.8051 

0.8078 

0.8106 

0.8133 

0.9 

0.8159 

0.8186 

0.8212 

0.8238 

0.8264 

0.8289 

0.8315 

0.8340 

0.8365 

0.8389 

1.0 

0.8413 

0.8438 

0.8461 

0.8485 

0.8508 

0.8531 

0.8554 

0.8577 

0.8599 

0.8621 

1.1 

0.8643 

0.8665 

0.8686 

0.8708 

0.8729 

0.8749 

0.8770 

0.8790 

0.8810 

0.8830 

1.2 

0.8849 

0.8869 

0.8888 

0.8907 

0.8925 

0.8944 

0.8962 

0.8980 

0.8997 

0.9015 

1.3 

0.9032 

0.9049 

0.9066 

0.9082 

0.9099 

0.9115 

0.9131 

0.9147 

0.9162 

0.9177 

1.4 

0.9192 

0.9207 

0.9222 

0.9236 

0.9251 

0.9265 

0.9278 

0.9292 

0.9306 

0.9319 

1.5 

0.9332 

0.9345 

0.9357 

0.9370 

0.9382 

0.9394 

0.9406 

0.9418 

0.9429 

0.9441 

1.6 

0.9452 

0.9463 

0.9474 

0.9484 

0.9495 

0.9505 

0.9515 

0.9525 

0.9535 

0.9545 

1.7 

0.9554 

0.9564 

0.9573 

0.9582 

0.9591 

0.9599 

0.9608 

0.9616 

0.9625 

0.9633 

1.8 

0.9641 

0.9649 

0.9656 

0.9664 

0.9671 

0.9678 

0.9686 

0.9693 

0.9699 

0.9706 

1.9 

0.9713 

0.9719 

0.9726 

0.9732 

0.9738 

0.9744 

0.9750 

0.9756 

0.9761 

0.9767 

2.0 

0.9772 

0.9778 

0.9783 

0.9788 

0.9793 

0.9798 

0.9803 

0.9808 

0.9812 

0.9817 

2.1 

0.9821 

0.9826 

0.9830 

0.9834 

0.9838 

0.9842 

0.9846 

0.9850 

0.9854 

0.9857 

2.2 

0.9861 

0.9864 

0.9868 

0.9871 

0.9875 

0.9878 

0.9881 

0.9884 

0.9887 

0.9890 

2.3 

0.9893 

0.9896 

0.9898 

0.9901 

0.9904 

0.9906 

0.9909 

0.9911 

0.9913 

0.9916 

2.4 

0.9918 

0.9920 

0.9922 

0.9925 

0.9927 

0.9929 

0.9931 

0.9932 

0.9934 

0.9936 

2.5 

0.9938 

0.9940 

0.9941 

0.9943 

0.9945 

0.9946 

0.9948 

0.9949 

0.9951 

0.9952 

2.6 

0.9953 

0.9955 

0.9956 

0.9957 

0.9959 

0.9960 

0.9961 

0.9962 

0.9963 

0.9964 

2.7 

0.9965 

0.9966 

0.9967 

0.9968 

0.9969 

0.9970 

0.9971 

0.9972 

0.9973 

0.9974 

2.8 

0.9974 

0.9975 

0.9976 

0.9977 

0.9977 

0.9978 

0.9979 

0.9979 

0.9980 

0.9981 

2.9 

0.9981 

0.9982 

0.9982 

0.9983 

0.9984 

0.9984 

0.9985 

0.9985 

0.9986 

0.9986 

3.0 

0.9987 

0.9987 

0.9987 

0.9988 

0.9988 

0.9989 

0.9989 

0.9989 

0.9990 

0.9990 

3.1 

0.9990 

0.9991 

0.9991 

0.9991 

0.9992 

0.9992 

0.9992 

0.9992 

0.9993 

0.9993 

3.2 

0.9993 

0.9993 

0.9994 

0.9994 

0.9994 

0.9994 

0.9994 

0.9995 

0.9995 

0.9995 

3.3 

0.9995 

0.9995 

0.9995 

0.9996 

0.9996 

0.9996 

0.9996 

0.9996 

0.9996 

0.9997 

3.4 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9998 
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Tabla A.5 Valores críticos para Distribuciones f t „ cu™ de densidad 

sombreada = a 


0 ‘a,v 


OL 


’ \ 

0.10 

0.05 

0.025 

0.01 

0.005 

0.001 

0.0005 

1 

3.078 

6.314 

12.706 

31.821 

63.657 

318.31 

636.62 

2 

1.886 

2.920 

4.303 

6.965 

9.925 

22.326 

31.598 

3 

1.638 

2.353 

3.182 

4.541 

5.841 

10.213 

12.924 

4 

1.533 

2.132 

2.776 

3.747 

4.604 

7.173 

8.610 

5 

1.476 

2.015 

2.571 

3.365 

4.032 

5.893 

6.869 

6 

1.440 

1.943 

2.447 

3.143 

3.707 

5.208 

5.959 

7 

1.415 

1.895 

2.365 

2.998 

3.499 

4.785 

5.408 

8 

1.397 

1.860 

2.306 

2.896 

3.355 

4.501 

5.041 

9 

1.383 

1.833 

2.262 

2.821 

3.250 

4.297 

4.781 

10 

1.372 

1.812 

2.228 

2.764 

3.169 

4.144 

4.587 

11 

1.363 

1.796 

2.201 

2.718 

3.106 

4.025 

4.437 

12 

1.356 

1.782 

2.179 

2.681 

3.055 

3.930 

4.318 

13 

1.350 

1.771 

2.160 

2.650 

3.012 

3.852 

4.221 

14 

1.345 

1.761 

2.145 

2.624 

2.977 

3.787 

4.140 

15 

1.341 

1.753 

2.131 

2.602 

2.947 

3.733 

4.073 

16 

1.337 

1.746 

2.120 

2.583 

2.921 

3.686 

4.015 

17 

1.333 

1.740 

2.110 

2.567 

2.898 

3.646 

3.965 

18 

1.330 

1.734 

2.101 

2.552 

2.878 

3.610 

3.922 

19 

1.328 

1.729 

2.093 

2.539 

2.861 

3.579 

3.883 

20 

1.325 

1.725 

2.086 

2.528 

2.845 

3.552 

3.850 

21 

1.323 

1.721 

2.080 

2.518 

2.831 

3.527 

3.819 

22 

1.321 

1.717 

2.074 

2.508 

2.819 

3.505 

3.792 

23 

1.319 

1.714 

2.069 

2.500 

2.807 

3.485 

3.767 

24 

1.318 

1.711 

2.064 

2.492 

2.797 

3.467 

3.745 

25 

1.316 

1.708 

2.060 

2.485 

2.787 

3.450 

3.725 

26 

1.315 

1.706 

2.056 

2.479 

2.779 

3.435 

3.707 

27 

1.314 

1.703 

2.052 

2.473 

2.771 

3.421 

3.690 

28 

1.313 

1.701 

2.048 

2.467 

2.763 

3.408 

3.674 

29 

1.311 

1.699 

2.045 

2.462 

2.756 

3.396 

3.659 

30 

1.310 

1.697 

2.042 

2.457 

2.750 

3.385 

3.646 

32 

1.309 

1.694 

2.037 

2.449 

2.738 

3.365 

3.622 

34 

1.307 

1.691 

2.032 

2.441 

2.728 

3.348 

3.601 

36 

1.306 

1.688 

2.028 

2.434 

2.719 

3.333 

3.582 

38 

1.304 

1.686 

2.024 

2.429 

2.712 

3.319 

3.566 

40 

1.303 

1.684 

2.021 

2.423 

2.704 

3.307 

3.551 

50 

1.299 

1.676 

2.009 

2.403 

2.678 

3.262 

3.496 

60 

1.296 

1.671 

2.000 

2.390 

2.660 

3.232 

3.460 

120 

1.289 

1.658 

1.980 

2.358 

2.617 

3.160 

3.373 

00 

1.282 

1.645 

1.960 

2.326 

2.576 

3.090 

3.291 
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